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Publication Title: 

Isolated DNA encoding sodium channel of the nervous system 



Abstract: 

Isolated DNA sequences (I) of 5908 bp (1, from rat) and 856 bp (3, human). 
Independent claims are also included for the following: (a) expression vector 
containing (I); (b) host cell transformed with this vector; (c) recombinant DNA (la) 
including a sequence derived from (I); (d) sodium channel protein (II) encoded by 
(I) or its allelic variants; (e) use of (II) for identifying inhibitors of sodium channel 
proteins that are resistant to tetrodotoxin (TTX); (f) mono- or poly-clonal 
antibodies (Ab) directed against (II); and (g) diagnostic kits containing (la) able to 
hybridize specifically to (I). 
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(?4) SEQUENCE D'ADN CODANT POUR UNE PROTEINE DE CANAL SODIQUE, SA PRODUCTION ET SON 
UTILISATION. 



&) L'invention decrit I'isolement d'une nouvelle sequence 
oacide nucieique codant pour un canal sodique mammalien 
dependant dubotentiel, de preference resistant a la tetrodo- 
toxine. Elle d6crit egalement des prodults polypeptidiques 
d'expression recomblnante de ces sequences, des vecteurs 
d'expresslon comprenant la sequence d'ADN et des cellules 
hdtes transformees par ces vecteurs d'expression. D'autres 
aspects de la presente invention sont des peptides dont les 
sequences sont basees sur les sequences d'aminoacides 
deduites de ces sequences d'ADN, des anticorps=specifi- 
ques de ces proteines et de ces peptides, des precedes 
pour la detection et la determination quantitative de telles 
proteines et d'acides nucieiques correspondents. Un autre 
aspect de l'invention est I'utilisation de ce canal sodique de- 
pendant du potentiel, de preference resistant a la tetrodo- 
toxine, comme cible therapeutique pour des composes. 
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Sequence d'ADN codant pour une proteine de canal 
sodique, sa production et son utilisation 

La presente invention concerne d'une fagon g6n§rale 
des proteines de canaux sodiques et plus particulidrement 
5 une nouvelle sequence d'acide nucleique codant pour une 
sous-unite a mammalienne d'une proteine de canal sodique 
de tissu nerveux, dependant du potentiel, de preference 
resistante a la tetrodotoxine . La presente invention con- 
cerne en outre sa production par la technique de recombi- 
10 naison. 

L' unite de base d ' information transmise d'une par- 
tie du systeme nerveux a une autre est un seul potentiel 
d' action ou influx nerveux. La "ligne de transmission" 
pour ces influx est l'axone ou fibre nerveuse. L'excitabi- 

15 lit§ §lectrique de la membrane du nerf s'est averee 

dSpendre du systeme de permeabilit§ ionique sensible a la 
tension de la membrane, qui lui permet d'utiliser l'Sner- 
gie emmagasinee dans des gradients de concentration 
ionique. L'activite electrique du nerf est declenchee par 

20 une depolarisation de la membrane, qui ouvre a travers la 
membrane des canaux qui sont hautement selectifs pour les 
ions sodium, qui sont ensuite entraines vers l'interieur 
par le gradient electrochimique . Parmi les nombreux canaux 
ioniques, le canal sodique dependant du potentiel ou sen- 

25 sible au potentiel est 1'un des plus etudies. II s'agit 



< 



2771103 



d'une proteine transmembranaire qui est essentielle pour 
la production de potentiels d' action dans des cellules 
excitables. Un excellent article de synthase sur les 
canaux ioniques est donne par Catterall, TINS 16(12), 500- 
5 506 (1993) . 

Les ADNc pour plusieurs canaux de Na* ont 6te clo- 
nes et sequences. Numa et coll./ Annals of the New York 
Academy of Sciences 479, 338-355 (1986), decrivent un ADNc 
provenant de 1'organe electrique de 1'anguille et deux 

10 ADNc diff brents provenant du cerveau de rat. Rogart, 
US-A-5 380 83 6, decrit un ADNc provenant de tissu car- 
diaque de rat; voir egalement Rogart et coll., Proc. Natl. 
Acad. Sex. 86, 8170-8174 (1989) . Les sequences de PN1 et 
de ses orthologues chez l'homme (hNE) et le lapin (Na*) 

15 ont §te publiees [voir par exemple Klugbauer et coll., 
EMBO J. 14,. 1084-1090 (1995) et Belcher et coll., Proc. 
Natl. Acad. Sci. USA 923, 11034-11038 (1995)]. La sequence 
de PN1 de rat clone a partir de ganglions de la racine 
dorsale (GRD) et son expression de fonction ont ete 

20 decrites [voir par exemple Sangameswaran et coll., J. 
Biol. Chem. 272, 14805-14809 (1997)]. D'autres canaux 
sodiques clones comprennent les types I et II (Noda et 
coll., Nature 320, 188-192 (1986)], Ha [Auld et coll., 
Neuron 1, 449-461 (1988)] et III [Kayano et coll., FEBS 

25 Lett. 228, 187-194 (1988)] de cerveau de rat, les canaux 
sodiques de muscle squelettique (SkMl) [Trimmer et coll., 
Neuron 3, 33-49 (1989)], NaCh6 de rat [Schaller et coll., 
J. Neurosci. 15, 3231-3242 (1995)], le canal sodique 
type III de nerf peripherique (rPN3) (Sangameswaran et 

30 coll., J. Biol. Chem. 271, 5953-5956 (1996), egalement 
denomme SNS, Akopian et coll., Nature 379, 257-262 
(1996)], le canal atypique de rat [Felipe et coll., J. 
Biol. Chem. 269, 30125-30131 (1994)] et le canal sodique 
glial de rat [Akopian et coll., FEBS Lett. 400, 183-187 

35 (1997)]. 
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Ces Etudes ont montrS que la sequence d' aminoacides 
du canal sodique avait £te conservee pendant une longue 
pSriode d' evolution. Ces etudes ont egalement revel^ que 
le canal etait un seul polypeptide contenant quatre 
5 sequences repSties internes, ou domaines homologues 

(domaines I-IV) ayant des sequences d' aminoacides simi- 
laires. Chaque domaine se replie en six segments trans- 
membranaires hSlicoidaux et predits: cinq sont des seg- 
ments hydrophobes et un est un segment hautement charge , 

10 comportant de nombreux residus lysine et arginine charges 
positivement . Ce segment hautement chargS est le quatri&me 
segment transmembranaire dans chaque domaine (le 
segment S4) et est susceptible d'etre implique dans 1' ac- 
tivation par le potentiel. Les chaines laterales chargees 

15 positivement sur le segment S4 sont susceptibles de s'ap- 
parier avec les chaines laterales chargSes n§gativement 
sur les cinq autres segments, de sorte que la dSpolarisa- 
tion de la membrane peut deplacer la position d'une helice 
par rapport a 1' autre, ce qui ouvre le canal. Des sous- 

20 unites accessoires peuvent modifier la fonction du canal. 

On a decouvert 1'utilite therapeutique de materiels 
recombinants issus de l'ADN des nombreux canaux sodiques. 
Par exemple, US-A-5 132 296 (Cherksey) decrit des canaux 
sodiques purifies qui se sont reveles utiles en tant 

25 qu'outils diagnostiques et therapeutiques . 

Des isoformes de canaux sodiques sont divisees en 
"sous-families". On utilise le terme "isoforme" pour desi- 
gner des proteines de canaux sodiques distinctes mais 
etroitement apparencies, c'est-S-dire celles ayant une 

30 homologie d' aminoacides d' environ 60-80 %. Ces dernieres 
manifestent. egalement une forte homologie de fonctions. On 
utilise le terme "sous-families" pour designer des canaux 
sodiques distincts qui ont une homologie d' aminoacides 
d' environ 80-95 %. On utilise des combinaisons de plu- 

35 sieurs facteurs pour determiner les distinctions au sein 
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d'une sous -famine, par exemple, la rapiditS d'un canal, 
la localisation chromosomique, les donates d' expression, 
l'homologie avec d'autres canaux au sein d'une meme 
espece, et l'homologie avec un canal de la meme sous- 
famille entre des espdces differentes. Une autre conside- 
ration est une af finite pour la tetrodotoxine ( " TTX 11 ) . La 
TTX est une toxine tr&s puissante provenant du tetrodon, 
ou poisson-globe, qui bloque la transmission des influx 
nerveux le long des axones et dans les membranes exci- 
tables des fibres nerveuses. La TTX se fixe au canal 
sodique et arrete le flux des ions sodium. 

Des etudes utilisant la TTX comme sonde ont eclaire 
beaucoup le mecanisme et la structure des canaux sodiques. 
II existe trois sous-types de canaux sodiques qui sont 
definis par l'af finite pour la TTX, qui peut etre mesuree 
par les valeurs de.la CI 5Q : canaux sodiques sensibles a la 
TTX (CI 50 = 1-30 nM) , canaux sodiques insensibles a la TTX 
(CI 50 = 1-5 /iM) et canaux sodiques resistants a la TTX 
(CI 50 * 50 MM) . 

Les potentiels d' action insensibles a la TTX ont 
ete etudies d'abord dans le muscle squelettique de rat 
(Redfern et coll., Acta Physiol. Scand. 82, 70-78 (1971)]. 
Ces potentiels d' action ont ete ensuite decrits dans 
d'autres tissus mammaliens, y compris le muscle squelet- 
tique mammalien de nouveau-ne, le muscle cardiaque mamma- 
lien, des cellules de ganglions de la racine dorsale de 
souris in vitro et en culture, des cellules L6 et de 
muscle squelettique mammalien en culture [voir Rogart, 
Ann. Rev. Physiol. 43, - 711-725 - (1980) ) . 

Les neurones des ganglions de la racine dorsale de 
rat possedent a la fois des courants de canaux sodiques 
sensibles a la TTX (CI 5Q - 0,3 nM) et des courants de 
canaux sodiques resistants a la TTX - 100 ^M) , comme 

decrit par Roy et coll. dans J. Neurosci. 12, 2104-2111 
(1992)) . On a egalement mesure des courants sodiques 
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resistants a la TTX dans des ganglions petreux et des gan- 
glions plexiformes de rat [voir Ikeda et coll., J. Neuro- 
physiol. 55, 527-539 (1986) et Stea et coll., Neurosci. 
47, 727-736 (1992) . Les Slectrophysiologistes pensent 
5 qu'un autre canal sodique resistant a la TTX reste & 
decouvrir . 

Bien que l'on connaisse des ADNc provenant de cer- 
veau, de coeur et de muscle squelettique de rat, 1' identi- 
fication et l'isolement d' ADNc § partir de tissu nerveux 

10 sensitif p§ripherique, tel que des ganglions de la racine 
dorsale, ont §te genes par la difficulty du travail avec 
un tel tissu. 

La presente invention fournit de nouvelles 
sequences purifiees et isolees d'acide nucleique, codant 

15 pour des proteines de canaux sodiques de tissu nerveux, de 
preference .resistantes la TTX, qui sont fortement expri- 
mees dans des ganglions plexiformes et des ganglions de la 
racine dorsale de l'adulte, moins fortement exprimees dans 
le cerveau, la moelle epiniere et les ganglions cervicaux 

20 superieurs, et ne sont pas exprimees dans le nerf scia- 

tique, le coeur ou le muscle squelettique. Sous des formes 
actuellement preferees, les nouvelles sequences d'ADN com- 
prennent des sequences d' ADNc codant pour la proteine de 
canal sodique de tissu nerveux de rat. Un aspect de la 

25 p r § se nte invention est la sous-unite a de cette proteine 
de canal sodique. 

L' invention a egalement pour objet l'ADN, l'ADNc et 
l'ARNm issus des sequences d'acide nucleique de 1' inven- 
tion, et l'ARNc issu de l'ARNm. En particulier, deux 

30 sequences d' ADNc ensemble codent pour le canal sodique 
entier de tissu nerveux de rat. 

La presente invention englobe egalement d'autres 
formes d'ADN, telles que de l'ADN genomique, de l'ADN pre- 
pare par synthese chimique partielle ou totale a partir de 

35 nucleotides, et de l'ADN comportant des deletions ou des 
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mutations. 

Encore un autre aspect de 1' invention est la nou- 
velle protSine de canal sodique de rat, resistante d la 
TTX, et des fragments de celle-ci, codes par l'ADN de la 
5 pr§sente invention. 

Un autre aspect de la presente invention consiste 
en des polynucleotides et oligonucleotides recombinants 
comprenant une sequence d'acide nucleique issue de la 
sequence d'ADN de la presente invention. 

Un autre aspect de 1' invention est un procedg de 
stabilisation de 1'ADNc entier qui code pour la sequence 
de la proteine de 1' invention. 

Un autre aspect de 1' invention comprend des vec- 
teurs depression comprenant l'ADN de 1' invention, des 
cellules hotes transformees ou transferees par ces vec- 

teurs et _une banque d' ADNc , de. ces cellules, hotes. 

La presente invention englobe egalement un essai 
pour la detection d' inhibiteurs de la proteine de canal 
potassique, comprenant la mise en contact d'un compose, 
soupcjonne etre un inhibiteur, avec un canal sodique 
exprime, et la mesure de l'activite du canal sodique. 

On fournit en outre un procede d' inhibition de 
l'activite du canal sodique resistant a la TTX, comprenant 
1' administration d'une quantity efficace d'un compose 
ayant une valeur CI 5Q de 10 MM ou moins. 

De plus, on fournit des precedes d' utilisation de 
l'ADN pour la production d'anticorps monoclonaux et 
d'anticorps polyclonaux, destines a etre utilises en tant 
que cibles moleculaires pour la decouverte de medicaments, 
en tant que marqueurs hautement specif iques d'antigenes 
specif iques, comme molecules detectrices, dans des essais 
diagnostiques, et pour des utilisations therapeut iques, 
telles que le soulagement de la douleur, en tant que sonde 
du canal PN5 dans un autre tissu mammalien, dans la con- 
ception d' agents therapeutiques et dans le criblage de 



2771103 



therapies . 

La presente invention est illustree & l'aide des 
dessins ci-annexes. Sur ces dessins: 

Les figures 1A-E representent la sequence native 
5 d'ADNc de 5 908 nucleotides codant pour le canal sodique 
type 5 ( ,f PN5 ,f ) de rat (SEQ ID n° 1), issu de deux clones 
d'ADNc chevauchants, d£sign6s par 26.2 et 1.18. 

Les figures 2A-F representent la sequence d'amino- 
acides deduite de PN5 (SEQ ID n° 2, representee dans le 
10 code d' aminoacides & trois lettres) . Les figures 2G-H, 

representant la sequence d' aminoacides deduite de PNS dans 
le code d' aminoacides a une seule lettre, montrent egale- 
ment les domaines homologues (I-IV) ; les segments trans - 
membranaires (S1-S6) supposes; l'aminoacide conferant la 
15 resistance a TTX (♦) ; les sites de N-glycosylation (•) ; le 
site de phosphorylation & .la.protSine kinase A (PKA) 
dependant de CAMP (o) et le codon de terminaison {*) . 

La figure 3A represente une sequence de 856 paires 
de bases pour le PN5 humain (SEQ ID n° 3) . La figure 3B 
20 represente la comparaison de sequence d' aminoacides du 
fragment hPNS avec le PN5 de rat. 

La figure 4 represente la sequence de la nouvelle 
sonde de domaine IV de canal sodique (SEQ ID n° 4) . 

Les figures 5A-E representent la sequence de 
25 5 334 nucleotides modifiee pour la stability et 1' expres- 
sion (SEQ ID n° 5) . Les nucleotides 24 k 5 518 constituent 
la region de 5 295 pb codant pour une proteine a 
1 765 aminoacides. 

La figure 6 represente la carte de clonage de PNS. 
30 La presente invention concerne une sequence d'acide 

nucleique purifiee et isolee codant pour une nouvelle pro- 
teine de canal sodique mammalienne, de preference resis- 
tante a la TTX. L' expression l! ADN purifie et isole" signi- 
fie de -l'ADN qui est essentiellement exempt, c'est-a-dire 
35 contient moins d' environ 30 %, de preference moins d'envi- 
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ron 10 %, et encore mieux de preference moins d' environ 
1 %, de l'ADN auquel est associe a 1'etat naturel l'ADN 
d'interet. Les techniques pour determiner la purete sont 
bien connues dans le domaine et comprennent, par exemple, 
5 la cartographie de restriction, 1' electrophorSse en gel 
d' agarose et la centrifugation en gradient de CsCl. 

Le terme "ADN" est destin§ & comprendre l'ADNc, ou 
ADN complementaire, qui consiste en sequences d'ADN simple 
brin ou double brin, produites par transcription inverse 

10 d'ARNm isol§ £ partir d'une cellule donneuse ou par syn- 
thase chimique. Par exemple, le traitement d'ARNm par une 
transcriptase inverse, telle que la transcriptase inverse 
d'AMV ou la transcriptase inverse de' M-MuLV, en presence 
d'une amorce oligonucleotidique, donnera un duplex ARN-ADN 

15 pouvant etre traite par de la RNase H, de 1' ADN polymerase 
et de 1' ADN ligase, pour.donner de l'ADNc double brin. Si 
on le desire, l'ADNc double brin peut etre denature par 
des techniques classiques, telles qu'un chauffage, pour 
donner de l'ADNc simple brin. Le terme "ADNc " comprend de 

20 l'ADN qui est une copie complementaire de l'ARNm existant 
dans la nature, ainsi que des copies complementaires de 
variants de l'ARNm existant dans la nature, qui ont la 
meme activite biologique. Les variants comprennent, par 
exemple, des insertions, des deletions, des sequences a 

25 codons degeneres et des alleles, 

Un f, ARNc " correspondant a l'ARNm transcrit a partir 
d'une sequence d'ADN codant pour la sous-unite <x d'une 
nouvelle proteine de canal sodique, de preference resis- 
tante £ la TTX, est envisage par la presente invention. 

30 Le terme "ARNc" designe un ARN qui est une copie de l'ARNm 
trancrit par une cellule. 

En particulier, 1' invention englobe de 1' ADN com- 
portant les versions natives des sequences nucleotidiques 
indiquees sur les figures 1A-E (SEQ ID n° 1) , designe ici 

35 par canal sodique type 5 (PN5) . Les figures 1A-E repre- 
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sentent le produit de construction d'ADNc a 5 908 nucleo- 
tides, comprenant un cadre de lecture ouvert de 
5 298 bases (y compris le codon d' arret) (SEQ ID n° 1) . 
Le residu nucleotidique 79 represente le site d' initiation 
5 et de traduction, et le residu 5367 represente la fin du 
codon d' arret. 

L' invention englobe egalement des versions modi- 
fiees de PN5, et en particulier la version representee sur 
les figures 5A-E (SEQ ID n° 5) . Le clone Sall-XJbal de 

10 5 334 nucleotides est dSpourvu de la plupart des sequences 
non traduites, du cadre de lecture ouvert de 5 298 nucleo- 
tides partant du nucleotide 24 et se terminant au nucleo- 
tide 5321. Les codons d' initiation et d' arret sont souli- 
gnes, comme le sont les mutations traductionnellement 

15 silencieuses au niveau des nucleotides 3932, 3935, 3941, 
3944 et 3947,> qui ont ete introduites pour bloquer un 
rearrangement dans cette region pendant la croissance dans 
E. coli. 

La sequence nucleotidique de SEQ ID n° 1 

20 (figures 1A-E) correspond aux ADNc de rat. Une recherche 
d' homologie a montre que le canal sodique le plus etroite- 
ment apparente se trouvait dans le canal cardiaque de rat, 
avec une homologie de 72,5 %. Les canaux les plus etroite- 
ment apparentes qui viennent ensuite sont rPNl, avec 72 %, 

25 et les types I et III de cerveau de rat, avec 71,8 % et 
71,3 %, respect ivement. Les homologies avec rPN3a, hPN3, 
rPN4, rPN4a, le type II de cerveau de rat et le muscle 
squelettique de rat vont chacune environ de 70 £ 71 %. 

En outre, un clone de 856 paires de bases (SEQ ID 

30 n ° 3), tel que represente sur la figure 3A, a ete isole a 
partir d'une banque d' ADNc de ganglions de la racine dor- 
sale (GRD) humains, et est etroitement apparente a la 
sequence d' aminoacides de PN5 de rat, avec une identite de 
79 % et une homologie de 86 %. La sequence de PN5 humain 

35 couvre la region entre IIIS1 et 1 ' interdomaine III/IV, qui 
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inclut la vanne d' inactivation rapide (a savoir IFM) qui 
est localised dans 1' interdomaine III/IV. 

Le terme "banque d ' ADNc " designe une collection de 
clones, habituellement dans un bacteriophage ou, moins 
5 communement, dans des plasmides bacteriens, contenant des 
copies d' ADNc de sequences d'ARNm issues d'une cellule 
donneuse ou d'un tissu donneur. 

On pense que les homologues supplementaires du nou- 
veau canal sodique de rat, resistant a la TTX, decrit ici, 
10 sont egalement exprimes dans un autre tissu mammalien. 

L' analyse northern blot (exemple 5) indique que PN5 
est code par un transcrit de ~ 6,5 kb. 

La sequence d'aminoacides deduite de PN5, represen- 
tee sur les figures 2A-F (SEQ ID n» 2) , manifeste les 
15 caracteristiques structurales primaires d'une sous-unite a 
d'un canal sodique dependant du potentiel, resistant a la 
TTX. Les figures 2G-H represented les domaines homologues 
(I-IV); les segments transmembranaires (S1-S6) supposes; 
l'aminoacide conferant la resistance a la TTX les 
sites de N-glycosylation (•) ; et les sites de phosphoryla- 
tion a la PKA cAMP- dependants (o) . Des sequences d'ADN 
codant pour les polypeptides de proteine de canal sodique 
identiques, analogues ou variants alleles du systeme ner- 
veux, par utilisation, au moins en partie, de codons dege- 
25 neres, sont egalement envisagees par la presente invention. 

Une caracteristique interessante ,de cette sequence 
d'aminoacides deduite est que l'aminoacide qui est le plus 
responsable de la sensibilite a la TTX est localise a la 
position 355 et n'est pas aromatique. Dans les canaux 
sodiques de type du cerveau humain et de rat, dans le 
canal du muscle squelettique et dans PN1 et PN4, cet 
aminoacide est la tyrosine ou la phenylalanine, et ces 
canaux sont tous sensibles a la TTX. Dans PN3 et PN5, 
l'aminoacide est la serine. Etant donne que PN3 est tres 
resistant a la TTX, 1' implication est que PN5 est egale- 



20 



30 



35 
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ment un canal resistant & la TTX, Le canal cardiaque com- 
porte un r6sidu cysteine a cette position et est "insen- 
sible" a la TTX. 

Bien que PN5 contienne toutes les caracteristiques 
5 distinctives d'un canal sodique dependant du potentiel, il 
a des caracteristiques structurales specifiques qui le 
distinguent des autres canaux sodiques. Par exemple, DIIS4 
comporte 5 aminoacides basiques conserves dans tous les 
canaux sodiques qui pourraient jouer un role significatif 

10 dans les aspects de detection de potentiel de la fonction 
de canal, Dans PN5, le premier aminoacide basique est rem- 
place par un residu alanine. De meme, dans DIIIS4, PN5 
comporte 5 aminoacides basiques au lieu des six qui sont 
presents dans d' autres sequences de canaux sodiques, le 

15 dernier residu arginine etant remplace par un residu glu- 
tamine.Dans DIIIS3, le segment transmembranaire ne con- 
tient que 18 aminoacides, par opposition a 22 aminoacides 
dans les autres canaux. En outre, la courte boucle de 
liaison (4 aminoacides) entre S3 et S4 dans Dili est meme 

20 plus courte, en raison d'une deletion de 3 aminoacides. Ce 
raccourcissement de S3 et de la boucle de liaison a ete 
confirme par la conception d' amorces dans la region appro- 
priee de la sequence pour un essai de RT-PCR (reaction 
d' amplification en chaine par polymerase- transcription 

25 inverse) & partir de GRD de rat, et sequenpage du fragment 
d'ADN amplifie. Un tel essai a ete effectuS pour confirmer 
la sequence d'une autre region de PN5, dans la boucle 
DIVS5-S6, oil il y avait une deletion d'un peptide de 
8 aminoacides. 

30 On a effectue une analyse de distribution tissu- 

laire d'ARN, par une reaction d' amplification en chaine 
par polymerase-transcription inverse (RT-PCR amorcee par 
oligonucleotide) , a partir des systemes nerveux periphe- 
rique et central de rat, en particulier a partir de GRD de 

35 rat. On a etudie huit types de tissus principaux quant a 
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1' expression des genes PN5 specif iques correspondants aux 
positions 5651-5903 de SEQ ID n° 1 (figures 1A-E) . L'ARNm 
de PN5 etait present dans cinq des tissus etudies: le cer- 
veau, la moelle epiniere, GRD, les ganglions plexiformes 
5 et les ganglions cervicaux superieurs. PN5 n' etait pas 

present dans les tissus restants etudies : le tissu de nerf 
sciatique, le tissu de muscle squelettique ou cardiaque. 
PN5 s'est r&vel6 etre le plus fort dans GRD et les gan- 
glions plexiformes, ce qui a conduit les demandeurs a pen- 

10 ser que le GRD etait enrichi en PN5. PN5 presente des dif- 
ferences considerables d'abondance parmi un ensemble de 
tissus, PN5 a un gradient d' expression avec une forte 
expression dans les GRD. PN5 a un gradient d' expression 
comme les autres canaux, mais une distribution plus limi- 

15 tee. 

L' invention comprend non seulement la protSine 
entidre exprimee par les sequences d'ADNc de SEQ ID n° 1, 
2 et 3, mais comprend egalement des fragments de pro- 
teines, Ces fragments peuvent etre obtenus par coupure des 

20 proteines entieres ou par 1' utilisation de plus courtes 
sequences d'ADN ou de plus courts polynucleotides, pour 
exprimer le fragment recherche. 

Tel qu'utilise ici, le terme "polynucleotide" 
designe une forme polymere de nucleotides de longueur 

25 quelconque, qu'il s'agisse de ribonucleotides ou de 
desoxyribonucleotides. Ce terme designe seulement la 
structure primaire de la molecule. Ainsi, ce terme com- 
prend de l'ADN simple brin et de l'ADN double brin, ainsi 
que de 1' ARN double brin et de 1' ARM simple brin. II com- 

30 prend egalement des formes modifiees, par exemple par 
methylation et/ou par coiffage, et des formes non modi- 
fiees du polynucleotide. 

En outre, le terme "polynucleotide" et destine a 
comprendre un polynucleotide recombinant qui est d'origine 

35 genomique, d'ADNc, semi-synthetique ou synthetique, qui, 
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en vertu de son origine ou d'une manipulation, n'est pas 
associe" i la totality ou une partie du polynucleotide 
auquel il est associe dans la nature et/ou est li€ a un 
polynucleotide autre que celui auquel il est lie dans la 
nature . 

En consequence, 1' invention comprend egalement des 
polynucleotides qui peuvent etre utilises pour produire 
des polypeptides ayant une longueur d' environ 10 a l 500, 
de preference de 10 a 100 aminoacides. L'isolement et la 
purification de tels polypeptides recombinants peuvent 
etre effectues par des techniques qui sont bien connues 
dans le domaine, par exemple des separations chromatogra- 
phiques preparatives ou la chromatographie d'af finite. En 
outre, des polypeptides peuvent egalement etre produits 
par des moyens synthetiques qui sont bien connus dans la 

technique . _ _ 

L' invention permet la manipulation de materiels 
genetiques par des techniques de recombinaison, pour pro- 
duire des polypeptides qui possedent les caracteristiques 
structurales et fonctionnelles de la nouvelle sous-unite « 
de canal sodique dependant du potentiel, resistante a la 
TTX, rencontree dans des nerf sensitifs. On peut utiliser 
la mutagenese dirigee sur site pour obtenir de tels poly- 
peptides recombinants. Par exemple, on peut inserer speci- 
25 fiquement des oligonucleotides synthetiques, ou les mettre 
specif iquement a la place d' oligonucleotides existants, 
dans le segment du gene d'interet, pour produire des genes 
codant pour et exprimant un mutant specif ique. On peut 
egalement insurer des oligonucleotides degeneres au hasard 
et on peut utiliser des techniques de visualisation de 
phages pour identifier et isoler des polypeptides ayant 
une propriete fonctionnelle d'interet. 

En outre, la presente invention envisage des poly- 
nucleotides recombinants ayant une longueur d' environ 15 a 
20 kb, de preference de 10 a 15 kb, comprenant une 
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sequence d'acide nucleique issue de l'ADN de 1' invention. 

Le terme "issu" d'une sequence designee se refere & 
une sequence d'acide nucleique qui est compos&e d'une 
sequence d' environ au raoins 6 a 8 nucleotides, de prefe- 
5 rence d'au moins 10 & 12 nucleotides et en particulier 
d'au moins 15 a 20 nucleotides qui correspondent a une 
region de la sequence designee, c' est-ci-dire sont homo- 
logues ou complementaires de celle-ci. La sequence derivee 
n'est pas nScessairement derivee physiquement de la 

10 sequence nucleotidique indiquee, mais peut etre issue 

d'une autre maniere, y compris, par exemple, la synthese 
chimique ou la replication d'ADN ou la transcription 
inverse, techniques qui sont basees sur 1' information 
fournie par les sequences de base dans la ou les regions 

15 desquelles est issu le polynucleotide. 

Un test d' expression neonatal a ete eff ectue avec 
Fll, une lignee de cellules de fusion congue a partir de 
GRD de rat nouveau-ne, soudee a une lignee cellulaire de 
souris, N18TG, provenant de Massachusetts General Hospi- 

20 tal. Fll repond a des agents trophiques, tels que le NGF 
(facteur de croissance des neurones), par extension de 
dendrites. On a constate que PN5 etait present a la fois 
dans Fll native et Fll traitee par NGF, ce qui a conduit 
les demandeurs a penser que le canal sodique etait exprime 

25 a l'etat natif dans Fll, 

Une hybridation in situ d'ARNm de PN5 avec un tissu 
de GRD de rat donne une localisation principalement dans 
les petits neurones et les neurones moyens, avec une 
absence dans les neurones de grande taille. 

30 on a egalement cartographie PN5 jusqu'a sa locali- 

sation cytogenetique sur des preparations de chromosomes 
de souris. PN5 est localise sur le meme chromosome que le 
canal cardiaque et PN3 . 

En general, les canaux sodiques comprennent une 

35 sous-unite a: et deux sous-unites j3. Les sous-unites /3 
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peuvent moduler la fonction du canal. Toutefois, £tant 
donne que la sous -unite cx est tout ce qui est requis pour 
que le canal soit totalement fonctionnel, 1' expression de 
l'ADNc dans SEQ ID n° 1 (figures 1A-E) donnera une pro- 
5 tSine totalement f onctionnelle. Le gene codant pour la 
sous-unitS /3 1 dans le tissu de nerf peripherique s'est 
revele etre identique S celui rencontre dans le coeur, le 
cerveau et le muscle squelettique de rat. L'ADNc de la 
sous-unite 0^ n'est pas decrit ici, puisqu'il est bien 

10 connu dans la technique [voir Isom et coll., Neuron 12, 
1183-1194 (1994)]. Toutefois, il doit etre entendu qu'en 
combinant la sequence connue codant pour la sous -unite & 1 
avec la sequence de la sous-unite a decrite ici, il est 
possible d'obtenir un canal sodique PN5 complet, dependant 

15 du potent iel, de preference resistant S la TTX. 

La presente invention comprend egalement des vec- 
teurs d' expression comprenant l'ADN ou l'ADNc decrit plus 
haut, des cellules hotes transformees par ces vecteurs 
d' expression, capables de produire le canal sodique de 

20 l' invention, ainsi que des banques d'ADNc comprenant de 
telles cellules hotes. 

Le terme "vecteur d' expression" signifie tout ele- 
ment genet ique, par exemple un plasmide, un chromosome, un 
virus, se comportant comme une uniti autonome d' expression 

25 de polynucleotide dans une cellule ou etant rendu capable 
de replication par insertion dans un chromosome d'une cel- 
lule hote, et auquel est attache un autre segment poly- 
nucleotidique, de maniere a provoquer la replication et/ou 
1' expression du segment attache. Des vecteurs appropries 

30 comprennent, mais sans se limiter a ceux-ci, des plas- 
mides, des bacteriophages et des cosmides. Les vecteurs 
contiendront les sequences polynucleotidiques qui sont 
necessaires pour effectuer la ligature ou 1' insertion du 
vecteur dans une cellule hote desiree et pour effectuer 

35 1' expression du segment attache. De telles sequences dif- 
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ferent en fonction de l'organisme hdte ou comprendront des 
sequences de promoteurs pour effectuer la transcription, 
des sequences d'activateurs pour accroitre la transcrip- 
tion, des sequences de sites de liaison au ribosome et 
des sequences de terminaison de transcription et de tra- 
duction. 

L' expression "cellule note" se refere en general a 
des organismes procaryotes ou eucaryotes et comprend tout 
organisme apte a la transformation ou a la transf ection, 
qui est capable d'exprimer une proteine et peut etre, ou a 
ete, utilise en tant que receveur de vecteurs d' expression 
ou d' autre ADN transf ere. On peut egalement contraindre 
des cellules h6tes a exprimer une proteine par injection 
directe d'ARNc exogene, pouvant etre traduit en la pro- 
teine d'interet. Une cellule note preferee est 1' ovocyte 
de Xenopus . . -. ..^ : 

Le terme " transforms " se refere a toute methode 
connue pour 1' insertion de sequences d' ADN ou d'ARN etran- 
ger dans une cellule bote procaryote. Le terme " trans - 
fecte" se refere a toute methode connue pour 1' insertion 
de sequences d' ADN ou d'ARN Stranger dans une cellule bote 
eucaryote. De telles cellules transf ormees ou transf ectees 
comprennent des cellules transformees ou transferees de 
facon stable, dans lesquelles 1' ADN insere est rendu 
capable de replication dans la cellule note. Elles com- 
prennent egalement des cellules exprimant temporairement, 
qui expriment pendant des durees limitees 1' ADN ou l'ARN 
insere. La technique de transformation ou de transf ection 
depend de la cellule bote qui est transf ormee. Elle peut 
comprendre 1' encapsidation du polynucleotide dans un virus 
ainsi que 1 ' introduction directe du polynucleotide, comme 
par exemple par lipof ection ou micro- injection. La trans- 
formation ou la transf ection peut entrainer 1' incorpora- 
tion de 1'ADN insere dans le genome de la cellule note ou 
le maintien de l'ADN insere dans la cellule note, sous 
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forme de plasmide. Des methodes de transformation sont 
bien connues dans la technique et comprennent, mais sans 
se limiter a celles-ci, l'infection virale, 1 'elect ropora- 
tion, la lipofection et 1' introduction directe provoquee 
5 par le phosphate de calcium. 

II doit etre entendu que la presente invention est 
destinee a inclure d'autres formes de vecteurs d' expres- 
sion, de cellules hotes et de techniques de transformation 
servant a des fonctions equivalentes et bien connues dans 
10 la technique. 

L' invention conceme egalement un essai d'inhibi- 
teurs de la nouvelle proteine de canal sodique resistance 
a la TTX, comprenant la mise en contact d'un compose, sou- 
pconne etre un inhibiteur, avec un canal sodique* exprime, 
et la mesure de l'activite du canal sodique. Le compose 
'jpeut etre un- compose-pratiquement pur d' origine synthe- 
tique, mis en contact dans un milieu aqueux, ou le compose 
peut etre une substance existant dans la nature, de sorte 
que le milieu d'essai est un extrait d'origine biologique, 
comme par exemple un extrait de cellules vegetales, ani- 
males ou microbiennes. L'activite PN5 peut etre mesuree 
par des methodes telles que 1' electrophysiologie (mise 
sous tension a l'aide de deux electrodes ou mise sous ten- 
sion par patch clamp de cellules entieres a l'aide d'une 
seule electrode), essais de flux d'ions guanidinium et 
essais de liaison a des toxines. Un "inhibiteur" est 
difini en general par la quantite entrainant une diminu- 
tion de plus de 50 % de l'activite PN5, de preference une 
diminution de plus de 70 % de l'activite PN5, encore mieux 
une diminution de plus de 90 % de l'activite PN5 . 

II existe de nombreuses utilisations de 1' inven- 
tion, dont quelques unes sont decrites ci-dessous: 
1 • Sonde pour canaux mammaliens 

Comme mentionne plus haut, on pense que des homo- 
logues supplementaires du nouveau canal sodique de rat 
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resistant a la TTX # decrit ici, sont Sgalement exprimes 
dans un tissu mammalien, en particulier dans un tissu 
humain. On peut utiliser comme sonde les ADNc entiers de 
canaux sodiques PN5 de rat de la presente invention pour 
5 decouvrir s'il existe dans le tissu humain de nouveaux 
canaux sodiques supplementaires, dependants du potentiel, 
de preference r£sistants a la TTX, et, s'ils existent, 
pour faciliter l'isolement des ADNc codant pour la pro- 
teine humaine. 

10 Les homologues humains des canaux PN5 de rat, 

resistants i la TTX, peuvent etre clones S l'aide d'une 
banque d' ADNc de GRD humain. Les GRD humains sont obtenus 
lors d'une autopsie. On homogen£ise le tissu congele et on 
extrait 1'ARN avec de 1' isothiocyanate de guanidine 

15 [Chirgwin et coll., Biochemistry 18, 5294-5299 (1979)]. 
L'ARN est fractionne en f one t ion de ia ---twilie-stnr un gra- 
dient de saccharose, pour 1' enrichissement en ARNm de 
grande taille, car les sous-unites a du canal sodique sont 
codees par des transcrits de grande taille (7-11 kb) . On 

20 prepare de 1'ADNc double brin en utilisant le necessaire 
d' ADNc Superscript Choice (GIBCO BRL) avec de l'oligo(dT) 
ou des amorces hexamdres au hasard. On ligature les se- 
gments de liaison EcoRI sur 1' ADNc. double brin, qui est 
ensuite phosphoryle. On construit la banque d' ADNc par 

25 ligature de l'ADNc double brin dans le vecteur bacterio- 
phage X ZAP II (Stratagene) , suivie d' encapsidation dans 
des particules phagiques. 

On 6tale les phages sur des plaques de 150 mm, sur 
un tapis de bacteries XLI-Blue MRF' (Stratagene) et on 

30 fait des repliques des plages sur des membranes en Nylon 
Hybond N (Amersham) . Les f iltres sont hybrides avec des 
sondes d' ADNc de PN5 de rat, par des techniques clas- 
siques, et detectes par autoradiographie ou chimilumines- 
cence. Le signal produit par les sondes PM5 de rat s'hy- 

35 bridant avec des clones humains posit if s, a une forte 
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stringence, devrait etre plus fort que ceux obtenus avec 
des sondes de canal sodique de cerveau de rat s'hybridant 
avec ces clones. Les plages positives sont purifiees 
davantage par dilution limitante et criblees a nouveau par 
hybridation ou PCR. La cartographie de restriction et la 
reaction d' amplification en chaine par polymerase identi- 
fieront des clones chevauchants qui peuvent etre assembles 
par des techniques classiques en l'homologue humain com- 
plet de PN5 de rat. Le clone humain peut §tre exprime par 
injection d'ARNc trancrit in vitro a partir du clone 
d'ADNc complet dans des ovocytes de Xenopus, ou par trans - 
fection d'une lignee cellulaire mammalienne avec un vec- 
teur contenant l'ADNc lie a un promoteur approprie. 
2 . Anticorps contre PN5 

Les polypeptides de 1' invention sont tres utiles 

pour la production d' anticorps diriges . centre ..PN5 _Ces 

anticorps peuvent etre utilises dans une chromatographie 
d'af finite pour purifier des proteines recombinantes ou 
des polypeptides recombinants de canaux sodiques, ou ils 
peuvent etre utilises en tant qu'outil de recherche. Par 
exemple, des anticorps fixes a une molecule rapporteuse 
peuvent etre utilises dans des techniques de coloration 
histochimique, pour identifier d'autres tissus et d'autres 
types cellulaires dans lesquels les PN5 sont presents, ou 
ils peuvent etre utilises pour identifier des regions 
fonctionnelles ou d' epitopes de la proteine de canal 
sodique de 1' invention. 

Les anticorps peuvent etre monoclonaux ou poly- 
clonaux et peuvent etre produits par des techniques qui 
sont bien connues dans le domaine. Des anticorps poly- 
clonaux sont produits comme suit: on utilise un conjugue 
immunogene, comprenant PN5 ou un fragment de celui-ci, 
eventuellement lie a une proteine porteuse, pour immuniser 
un mammifere choisi, tel que la souris, le rat, la chevre, 
35 etc. On recueille et traite selon des techniques connues 
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du serum provenant du mammifere immunise, pour separer la 
fraction d' immunoglobuline. 

Des anticorps monoclonaux sont produits par la 
technique classique d'hybridomes, basee sur celle rappor- 
tee par Kohler et Milstein dans Nature 256, 495-497 
(1975) . Des cellules spleniques sont obtenues a partir 
d'un animal hdte immunise avec la proteine PN5 ou un frag- 
ment de celle-ci, eventuellement liees a une substance 
porteuse. Des cellules hybrides sont formees par fusion de 
ces cellules spleniques avec une lignee de myelome appro- 
priee, et cultivees. Les anticorps produits par les cel- 
lules hybrides sont cribles en fonction de leur aptitude a 
se lier a des proteines PN5 exprimees. 

On peut utiliser un certain nombre de techniques de 
criblage bien connues dans le domaine, comme par exemple 

des ..J?ithodes de criblage par . essai immunoenzymatique 

direct ou indirect utilisant un corps adsorbe. On soumet 
ensuite les cellules hybrides produisant de tels anticorps 
a un reclonage ou a des conditions de forte dilution, afin 
de selectionner une cellule hybride secretant une popula- 
tion homogene d' anticorps specif iques de l'une ou 1' autre 
proteine de PN5. 

En outre, des anticorps peuvent etre suscites par 
clonage et expression de sequences nucleotidiques ou de 
versions mutees de celles-ci, codant au moins pour les 
sequences d'aminoacides requises pour la fixation speci- 
fique d' anticorps naturels, et ces proteines exprimees 
peuvent etre utilisees en tant qu' immunogenes . Les anti- 
corps peuvent comprendre 1' immunoglobuline complete ou un 
fragment de celle-ci. Les anticorps peuvent etre lies a un 
groupe rapporteur, comme decrit plus haut a propos des 
polynucleotides . 

L' exemple 10 illustre la mise en pratique de la 
production d'un anticorps. 
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3. Cibles therapeutiques pour des composes pour le traite- 
ment de troubles et essais de ceux-ci 



La presente invention englobe egalement 1' utilisa- 
tion de la nouvelle sous -unite a de canal sodique depen- 
dant du potentiel, de preference resistante a la TTX, en 
tant que cible therapeutique pour des composes destines au 
traitement de troubles du systeme nemeux, sur la base des 
donnees de localisation de RT-PCR. Les troubles com- 
prennent, mais sans se limiter a ceux-ci, l'epilepsie, une 
lesion due a une attaque cerebrale, une lesion cerebrale, 
la neuropathie diabetique, une lesion traumatique, la dou- 
leur neuropathique chronique et la neuropathie associee au 
SIDA. 

4. Conception d' agents therapeutiques i base de PN5 inhi- 

15 biteur et essais de ceux-ci 

.La. presente invention est egalement orientee vers r 
1' inhibition de l'activite de PN5 dans des tissus du cer- 
veau, de la moelle epiniere, de ganglions de la racine 
dorsale, de ganglions plexiformes et de ganglions cervi- 
caux superieurs. Toutefois, il doit etre entendu que des 
etudes ulterieures peuvent reveler que PN5 est present 
dans d'autres tissus, et, en tant que tels, ces tissus 
peuvent egalement etre des zones cibles. Par exemple, la 
detection d'ARNm de PN5 dans des ganglions plexiformes 
25 suggere que PN5 peut conduire des courants de sodium 
resistants a la TTX dans ces ganglions et d'autres gan- 
glions sensitifs du systeme nerveux. 

En outre, il s'est averS que des proteines qui ne 
sont pas normalement exprimees dans certains tissus sont 
exprimees dans un etat pathologique . En consequence, la 
presente invention est destinee a englober 1' inhibition de 
PN5 dans des tissus et des types cellulaires dans lesquels 
la proteine est normalement exprimee, et dans des tissus 
et des types cellulaires dans lesquels la proteine n'est 
exprimee qu'au cours d'un etat pathologique. 
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Par exemple, on pense que des canaux sodiques 
rSsistants S la TTX jouent un role cle dans la transmis- 
sion d' influx nerveux en relation avec des signaux senso- 
riels tels que la douleur et la pression. Cette informa- - 
tion facilitera la conception d' agents therapeutiques qui 
peuvent etre cibles vers une zone determinee, telle qu'un 
tissu nerveux peripherique . 

La proteine recombinante de la presente invention 
peut etre utilisee pour l'essai d' agents thSrapeutiques 
potentiels ayant 1' aptitude & inhiber le canal sodique 
d'interet. En particulier, elle serait utile pour inhiber 
selectivement la fonction de canaux sodiques dans des tis- 
sus nerveux peripheriques responsables de la transmission 
de signaux de douleur et de pression sans affecter en meme 
temps la fonction de canaux sodiques dans d'autres tissus, 
tels que le coeur et le muscle. Une telle selectivity per- 
mettrait le traitement de la douleur sans provoquer d'ef- 
fets secondaires dus a des complications cardiaques ou 
neuromusculaires . En consequence, il serait utile d' avoir 
des sequences d'ADN codant pour des canaux sodiques expri- 
mees selectivement dans un tissu nerveux peripherique, 
5 . Analgesique 

Les canaux sodiques dans le tissu nerveux periphe- 
rique jouent un role important dans la transmission d' in- 
flux nerveux, et sont par consequent un outil pour com- 
prendre la transmission de la douleur neuropathique. La 
douleur neuropathique se repartit en deux composantes: 
l'allodynie, dans laquelle un stimulus normalement non 
douloureux le devient, et 1' hyperalgesie, dans laquelle un 
stimulus habituellement normalement douloureux devient 
extremement douloureux. 

Dans des etudes de localisation tissulaire, l'ARNm 
de PN5 se trouve dans les petits neurones et les neurones 
moyens de GRD. L'ARNm de PN5 est egalement present dans le 
cerveau et la moelle epiniere. L' inhibition de ses activi- 
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tes peut faciliter la prevention de troubles tels que les 
maux de tete et les migraines- La possibility d' inhiber 
l'activite de ces canaux sodiques, c'est-i-dire de reduire 
la conduction d' influx nerveux, affectera 1' aptitude du 
nerf a transmettre les influx douloureux. V inhibition 
selective des canaux sodiques dans des neurones sensitifs 
tels que GRD permettra 1' arret d' influx douloureux sans 
effets secondaires indesirables provoques par 1' inhibition 
des canaux sodiques dans d'autres tissus tels que le cer- 
veau et le coeur. En outre/ certaines maladies sont provo- 
quees par des canaux sodiques qui produisent des influx a 
une frequence extremement elevee. La possibility de 
reduire l'activite du canal peut alors eliminer ou atte- 
nuer la maladie. En consequence, on peut cribler des com- 
poses therapeutiques potentiels par des methodes bien con- 
nues dans la technique, pour decouvrir s'ils peuvent inhi- 
ber l'activite du canal sodique recombinant de 1' invention 
(Barram M, et coll., Naun-Schmiedeberg' s Archives of 
Pharmacology 347, 125-132 (1993), et McNeal E.T. et coll., 
J. Med, Chem. 28, 381-388 (1985)]. Pour des etudes simi- 
laires avec le recepteur d' acetylcholine, voir Claudio et 
coll., Science 238, 1688-1694 (1987). 

Par exemple, on peut soulager la douleur par inhi- 
bition de l'activite du nouveau canal sodique, de prefe- 
rence resistant a la TTX, par administration d'une quan- 
tity therapeutiquement efficace d'un compose ayant une 
CI 5Q d' environ 10 jiM ou moins, de preference * 1 juM. Des 
composes therapeutiques potentiels sont identifies sur la 
base de leur aptitude a inhiber l'activite de PN5 . En con- 
sequence, l'essai mentionne plus haut peut etre utilise 
pour identifier des composes ayant une CI 5Q therapeutique- 
ment efficace. 

Le terme "CI 50 " designe la concentration d'un com- 
pose qui est requise pour inhiber £ 50 % l'activite de PN5 
exprimee, lorsque l'activite est mesuree par electro- 
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physiologie, essais de flux et essais de liaison a des 
toxines, comme mentionne plus haut. 
6. Essais de diagnostic 

Les techniques de biologie moleculaire de base uti 
5 lisees dans la mise en oeuvre de la presente invention, 
telles que l'isolement d'ARN, d'ADN et de plasmides, la 
digestion par des enzymes de restriction, la construction 
et le sondage d'une banque d'ADNc, le s£quen<?age de 
clones, la construction de vecteurs d' expression, la 

10 transformation de cellules, le maintien et le d£veloppe- 
ment de cultures cellulaires et d'autres techniques g§ne- 
rales, sont bien connues dans le domaine, et on peut trou 
ver les descriptions de ces techniques dans des manuels 
generaux de laboratoire, tels que Molecular Cloning: A 

15 Laboratory Manual par Sambrook et coll. (Cold Spring 
Harbor Laboratory Press, 2 e edition, 1989) . 

Par exemple, les polynucleotides de 1' invention 
peuvent etre lies i une "molecule rapport euse" , pour la 
formation d'une sonde polynucleotidique utile pour des 

20 analyses northern et Southern blot et des hybridations in 
situ . 

1/ expression "molecule rapporteuse" designe une 
entite chimique pouvant etre detectee par un moyen de 
detection approprie, comprenant, mais sans se limiter a 

25 ceux-ci, des moyens spectrophotometriques, chimilumines- 
cents, immunochimiques ou radiochimiques . Les polynucleo- 
tides de la presente invention peuvent etre conjugu§s S 
une molecule rapporteuse par des techniques bien connues 
dans le domaine. Normalement, la molecule rapporteuse con 

30 tient un groupe fonctionnel approprie a 1 ' attachement au 
polynucleotide ou a 1 ' incorporation dans celui-ci. Les 
groupes fonctionnels appropries £ 1' attachement du groupe 
rapporteur sont habituellement des esters actives ou des 
agents d' alkylation. Des details techniques pour l'atta- 

35 chement de groupes rapporteurs sont bien connus dans le 
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domaine; voir par exemple Matthews J. A., Batki A., 
Hynds C. et KrickaL.J., Anal. Biochem. 151, 205-209 
(1985) et Engelhardt et coll., EP-A-0 302 175. 

La presente invention est illustree par les 
5 exemples descriptifs et non limitatifs ci-apres. 

Abreviations 

Les abreviations suivantes sont utilisees dans les 
exemples et ont les significations donnees ci-dessous. 
ASB : albumine de serum bovin 
10 EDTA: acide ethylenediaminetetraacetique, sel tetra- 
sodique 

GRD : ganglions de la racine dorsale 
MEN : MOPS 20 mM, EDTA 1 mM, acetate de sodium 5 mM, 
pH 7,0 

15 MOPS: acide 3- (N-morpholino) propanesulf onique (Sigma 
Chemical Company) 
PN5 : canal sodique 5 de nerf peripherique 
SDS : dodecylsulf ate de sodium 
SNP : systeme nerveux peripherique 
20 Solution de Denhardt : 0,02 % d' ASB, 0,02 % de polyvinyl- 
pyrrolidone, 0,02 % de Ficoll (0,1 g d' ASB, 0,1 g de 
Ficoll, 0,1 g de polyvinylpyrrolidone pour 500 ml) 
SSC : NaCl 150 mM, citrate de sodium 15 mM, pH 7,0 
SSPE: NaCl 80 mM, phosphate de sodium 10 mM, 
25 ethylenediaminetetraacetate 1 mM, pH 8,0 

TEV : pince de tension a deux electrodes 
TTX : tetrodotoxine (Sigma Chemical Company) . 

EXEMPLES 

Les exemples ci-apres illustrent la mise en pra- 
30 tique de 1' invention, 
Materiels 

Le plasmide pBK-CMV a ete obtenu aupres de 
Stratagene (La Jolla, CA, USA) ; le plasmide pBSTA est 
decrit par Goldin et coll. dans Methods in Enzymology 
35 (Rudy £c Iverson editeurs) 207, 279-297; le plasmide pCIneo 
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a 6t6 obtenu auprds de Promega (Madison, WI, USA) ; et le 
plasmide pCRII a ete obtenu auprSs d'Invitrogen (Carlsbad, 
CA, USA) . 

Le plasmide vecteur d' expression dans des ovocytes 
5 pBSTAcIIr a ete construit a partir de pBSTA par insertion 
d'un lieur oligonucleotidique synthetique; le plasmide 
pKK232-8 a ete obtenu aupres de Pharmacia Biotech 
(Piscataway, NJ, USA) ; le plasmide pCRII a ete obtenu 
aupres d'Invitrogen (San Diego, CA, USA) . Les lignees cel- 
10 lulaires de E. coli competentes STBL2 W et SURE® ont ete 
obtenues aupres de Gibco/BRL et Stratagene, respect ive- 
ment . 

EXEMPLE 1 

Obtention d'ARN a partir de GRD, de cerveau et de moelle 

15 epiniere de rat 

Sous un microscope a dissection, on a prSleve les 
GRD lombaires n° 4 et n° 5 (L4 et L5) , le cerveau et la 
moelle epiniere de rats Sprague-Dawley males adultes anes- 
thesies. Les tissus ont ete congeles dans de la glace car- 

20 bonique et homogeneises a 1 9 aide d'un homogeneisateur 

Polytron; on a extrait l'ARN par la methode a I'isothio- 
cyanate de guanidine (voir Chomczynksi et coll., Anal. 
Biochemistry 162, 156-159 (1987)]. On a dissous l'ARN 
total (5 jig de chaque echantillon) dans du tampon MEN con- 

25 tenant 50 % de formamide, 6,6 % de formaldehyde et dena- 
ture £ 65°C pendant 5-10 minutes. On a soumis l'ARN k une 
electrophorese sur un gel d' agarose a 0,8 % contenant 
8,3 % de formaldehyde, dans du tampon MEN. Le tampon 
d' electrode etait du tampon MEN contenant 3,7 % de formal- 

30 dehyde; on a fait fonctionner le gel a 50 V pendant 12- 
18 heures. 

On a soumis a 1 ' electrophorese dans des colonnes 
paralleles du gel des marqueurs de taille moleculaire, 
comprenant les ARN ribosomiques 18S et 28S et des mar- 
35 queurs d ' ARM (GIBCO BRL) . Leurs positions ont ete determi- 
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nees par coloration au bromure d'gthidium (0,5 jig/ml) de 
la colonne excisee, suivie d'une photographie sous lumi£re 
UV. 

Apr£s 1'electrophorSse, on a rinc§ le gel dans SSC 
2x et on a transfSre I'ARN sur une membrane de Duralose 
(Stratagene) avec SSC 20x, par action capillaire; la mem- 
brane a ete chauffee sous vide pendant 1 heure a 80°C. 

EXEMPLE 2 

Sonde provenant de IIA de cerveau de rat 

On a synthetise in vitro une sonde d'ARNc marquee 
au 32 P, complementaire des nucleotides 4637-5868 de la 
sequence de sous-unite a de canal sodique IIA de cerveau 
de rat, avec de l'ARN polymerase de T7 (Pharmacia), en 
utilisant de l'ADN matrice de pEAF8 (Noda et coll., Nature 
320, 188-192 (1986)] qui avait ete linearise a l'aide de 
BstEII. 

On peut trouver des protocoles pour chaque tech- 
nique mentionnee ci-dessus dans Molecular Cloning: A Labo- 
ratory Manual par Sambrook et coll. (Cold Spring Harbor 
Laboratory Press, 2 e edition, 1989) . 

EXEMPLE 3 

Hybridation d'ARN avec la sonde provenant de IIA de cer- 

veau de rat 

La membrane de l'exemple 1 a ete prehybridee pen- 
dant 16 heures k 42°C dans 50 % de formamide, SSC 5x, 
phosphate de sodium 50 mM, pH 7,1, solution de Denhardt 
lx, 0,5 % de SDS et 1 mg/ml d'ADN de spermatozoides de 
saumon cisaille, denature par la chaleur. La membrane a 
ete hybridee pendant 18 heures & 42°C dans 50 % de forma- 
mide, SSC 5x, phosphate de sodium 50 mM, pH 7,1, solution 
de Denhardt lx, 0,5 % de SDS et 200 ug/ml d'ADN de sperma- 
tozoides de saumon cisaille, denature par la chaleur, avec 
la sonde d'ARNc marquee au 32 P (environ l-3xl0 6 cpm/ml) 
decrite dans l'exemple 2. 
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On a rincS la membrane pendant 20 minutes avec SSC 
2x # 0,1 % de SDS, 3 la temperature ambiante, et on l'a 
ensuite lav£e successivement avec SSC 2x, 0,1 % de SDS a 
55°C pendant 30 minutes; SSC 0,2x, 0,1 % de SDS a 65°C 
pendant 30 minutes; SSC 0,2x, 0,1 % de SDS a 70°C pendant 
30 minutes et SSC 0,2x, 0,1 % de SDS, 0,1 % de pyro- 
phosphate de sodium a 70°C pendant 20 minutes. Le filtre a 
ete expose contre un film Kodak X-omat AR a -80°C, avec 
des ecrans amplif icateurs, pendant jusqu'a 2 semaines. 

La sonde de pEAF8 s'est hybridee avec les ARNm dans 
l'echantillon de GRD, avec des tailles de 11 kb, 9,5 kb, 
7,3 kb et 6,5 kb, estimees sur la base de leurs positions 
par rapport aux etalons. 

EXEMPLE 4 

Nouvelle sonde de domaine IV de canal sodique 

La sonde a ete obtenue comme suit: on a effectue 
une RT-PCR sur de l'ARN isole a partir de GRD de rat, en 
utilisant des amorces oligonucleotides degenerees qui 
6taient congues sur la base des homologies entre les 
canaux sodiques connus dans le domaine IV. Les produits de 
domaine IV ont ete clones dans un vecteur plasmidique, 
transformes dans E, coli t et on a isole des colonies indi- 
viduelles. Les produits de PCR specif iques du domaine IV, 
obtenus £ partir de plusieurs de ces colonies, ont ete 
sequences individuellement . La nouvelle sequence de 
domaine IV clonee etait la suivante (SEQ ID n° 4): 
1 CTCAACATGG TTACGATGAT GGTGGAGACC 
51 GACGAAGGTT CTGGGCAGAA TCAACCAGTT 
101 GCGAGTGTGT GATGAAGATG TTCGCCCTGC 
151 GGCTGGAACG TGTTCGACTT CATAGTGGTG 
201 GCTGTTTCT GCAATCCTTA AGTCACTGGA 
251 TCTTCCGGGT CATCCGTCTG GCCAGGATCG 
301 CGAGCAGCCA AGGGG ATTCG CACGCTGCTC 
351 GCCCGCCCTC TTCAACATCG GCCTCCTCCT 
401 ACTCCATCTT CGGCATGGCC AGCTTCGCTA 



GACGAGCAGG 
CTTTGTGGCC 
GACAGTACTA 
ATCCTGTCCA 
AAACTACTTC 
GCCGCATCCT 
TTCGCCCTCA 
CTTCCTCGTC 
ACGTCGTGGA 



GCGAGGAGAA 
GTCTTCACGG 
TTTCACCAAC 
TTGGGAGTCT 
TCCCCGACGC 
CAGGCTGATC 
TGATGTCCCT 
ATGTTCATCT 
CGAGGCCGGC 
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451 ATCGACGACA TGTTCAACTT CAAGACCTTT GGCAACAGCA TGCTGTGCCT 
501 GTTCCAGATC ACCACCTCGG CCGGCTGGGA CGGCCTCCTC AGCCCCATCC 
551 TCAACACGGG GCCTC.CCTAC TGCGACCCCA ACCTGCCCAA CAGCAACGGC 
601 TCCCGGGGGA ACTGCGGGAG CCCGGCGGTG GGCATCATCT TCTTCACCAC 
5 651 CTACATCATC ATCTCCTTCC TCATCGTGGT CAACATGTAT ATCGCAGTCA 
701 TC 

Cette sequence a et6 marquee au 32 P par amorgage au 
hasard. 

EXEMPLE 5 

10 Hybridation d'ARN avec la nouvelle sonde 3'-UTR de canal 

sodique 

On a prepare une empreinte northern blot avec 10 jig 
d'ARN total provenant de cerveau, de moelle epiniere et de 
GRD de rats. L'etnpreinte a ete hybridee avec une sonde 

15 d'ARNc provenant de la region non traduite en 3' (3'-UTR). 
La 3'-UTR a ete clonee dans le vecteur pSP73, et 1'ARNc a 
ete transcrit k 1'aide d'un necessaire Trans Probe T 
(Pharmacia Biotech) et de [ 32 P]-UTP. L'etnpreinte a ete 
prehybridee pendant 2 heures a 65 °C dans une solution con- 

20 tenant SSC 5x, solution de Denhardt lx, 0,5 % de SDS, 

phosphate de sodium 50 mM, pH 7,1, 1 mg/ml d'ADN de sper- 
matozoides de saumon et 50 % de formamide. L' hybridation a 
ete effectuee a 45°C pendant 18 heures dans la solution 
ci-dessus, mis & part que 1'ADN de spermatozoldes de sau- 

25 mon a 6te inclus a une concentration de 200 fig/ml et qu'on 
a ajoute la sonde marquee au 32 P i raison de 
7,5xl0 5 cpm/ml de solution, L'empreinte a ete ensuite 
lavee trois fois avec SSC 2x et 0,1 % de SDS a la tempera- 
ture ambiante, une fois avec SCC 0,2x et 0,1 % de SDS a 

30 65°C pendant 20 minutes, et une fois avec SSC 0,2x, 0,1 % 
de SDS et 0,1 % de pyrophosphate de sodium a 65°C pendant 
20 minutes. L'empreinte a ete analysee sur un appareil 
Phospholmager (BioRad) , apres une exposition de 2 jours. 
Les resultats ont indique qu'il y avait un signal de bande 

35 de - 6,5 k±>, present dans le cerveau, seulement dans la 
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colonne contenant de 1'ARN provenant de GRD, En raison de 
la faible abondance d'ARN de PN5, comme l'a montre l'essai 
de RT-PCR, la bande de 6,5 kb n'etait pas decelable dans 
le cerveau ni la moelle epiniere. 
5 EXEMPLE 6 

Construction et criblage d'une banque d'ADNc provenant de 

GRD de rat 

On a prepare une banque d'ADNc adaptee a EcoRI a 
partir d'ARN poly (A)* de GRD de rat Sprague-Dawley male 

10 adulte normal/ en utilisant le systeme Superscript Choice 
(GIBCO BRL) . L'ADNc (> 4 kb) a ete selections! par frac- 
tionnement en gradient de saccharose, comme decrit par 
Kieffer, Gene 109, 115-119 (1991) . L'ADNc a et<§ ensuite 
ligature dans le vecteur Zap Express (Stratagene) et enca- 

15 pside & l'aide de 1'extrait d' encapsidation dans \ 

Gigapack II XL (Stratagene) . De meme, on a synthetise une 
banque d'ADNc de GRD de > 2 kb. 

Les phages (3,5x10 s ) ont ete cribles par hybrida- 
tion sur filtre avec une sonde marquee au 32 P [rBIIa, 

20 bases 4637-5868 comme suit, d'Auld et coll,, Neuron 1, 

449-461 (1988)]. Les filtres ont ete hybrides dans 50 % de 
formamide, SSPESx, solution de Denhardt 5x, 0,5 % de SDS, 
250 jig/ml d'ADN de spermatozoides de saumon cisaille, 
denature, et phosphate de sodium 50 mM, a 42°C, et laves 

25 dans SSC 0,5x/0,l % de SDS, a 50°C. 

Des empreintes Southern blot de plasmides digeres 
par EcoRI ont ete hybridees avec la sonde d'ADN marquee au 
32 P (SEQ ID n° 4) . Les filtres ont ete ensuite hybrides a 
42°C dans 50 % de formamide, SSC 6x, solution de Denhardt 

30 5x, 0,5 % de SDS et 100 Mg/ml d'ADN de spermatozoides de 
saumon cisaille, denature, et ont ete laves dans SSC 
0, lx/0,1 % de SDS, a 65°C. 

On a excise des clones positifs in vivo dans pBK- 
CMV, en utilisant le systeme ExAssist/XLOLR (Stratagene) . 
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EXEMPLE 7 

Clones et analyse des nucleotides 

On a isole des clones d'ADNc, 26.2 et 25. l, a par- 
tir de la banque d'ADNc, et on a isole le clone 1.18 a 
partir de la banque d'ADNc de GRD de > 2 kb. Par analyse 
de la sequence, 26.2 est apparu comme 4tant un ADNc com- 
plet codant pour un nouveau canal sodique, et 25.1 s'eten- 
dait du domaine II a la 3'-UTR. Toutefois, chacun compor- 
tait une deletion qui tronquait la region codante. Le 
clone 1.18 comportait la region non traduite en 3', en 
plus de l'extremite C-terminale de la sequence d' amino- 
acides deduite de PN5 . Le produit de construction dans le 
vecteur d' expression pBSTACIIr consistait en sequences 
provenant de 26.2 et 1.18. 

On a obtenu l'homologie de' PN5 avec les autres 
canaux sodiques connus en utilisant le programme GAP/Best 



Fit (GCG) : 

Canal % de similarity % d'identite 

PN3a 71 54 

hPN3 71 55 

PN4 71 53 

PN4a 71 53 

PN1 72 55 

Type I de cerveau de rat 72 55 

Type II de cerveau de rat 71 54 

Type III de cerveau de rat 71 54 

Canal cardiaque de rat 73 56 
Canal de muscle squelet- 

tique de rat 71 53 
Stabilisation de 1'ADN comDlet de PN5 



A. Milieux, lignees cellulaires de E. coli et conditions 

de culture 

La culture de fragments de PN5 a pu etre realisee 
dans des conditions classiques, mais la culture de plas- 
mides contenant des produits de construction complets de 
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PN5 (dans pCIneo, pBSTAcIIr et d'autres vecteurs) ne pou- 
vait pas etre effectuee sans utilisation de milieux de 
culture speciaux, de conditions particulidres et de 
souches spSciales de E. coli. Les conditions suivantes se 
sont rgvSl§es §tre optimales: (1) utilisation de E. coli 
STBL2™ pour la transformation primaire apres des reactions 
de ligature et pour une culture a grande echelle; (2) le 
milieu solide Stait FM 0,5x (voir ci-dessous) + LB lx (1 % 
de tryptone, 0,5 % d'extrait de levure, 0,5 % de NaCl) + 
15 g/1 de gelose, ou FM Ix + LB 0,5x ; (3) le milieu 
liquide etait de fagon optimale FM lx + LB 0 , 5x; (4) on a 
utilise 100 /ig/ml de carbenicilline pour tous les milieux, 
etant donne qu'elle etait moins rapidement metabolisee que 
l'ampicilline; (5) la temperature pour la croissance ne 
devait pas etre superieure a 30°C, normalement de 24-26°C; 
cela demandait de plus longues durSes de culture que 
celles normalement utilisSes, allant de 24 a 72 heures . 
Milieu de congelation 2x (FM 2x) : 



FM 2x et les composants restants du milieu sont prepares 
separement, sterilises par passage a 1' autoclave, refroi- 
dis jusqu'a au moins 60°C, et ajoutes ensemble pour la 
formation du milieu final. La carbenicilline est preparee 
a raison de 25 mg/ml de H 2 0 et sterilisee par filtration. 
FM 2x a ete decrit en premier lieu pour la preparation de 
suspensions de base congelees de cellules bacteriennes 
[Practical Methods in Molecular Biology, Schleif R.F.et 
Wensing P.C. , Springer-Verlag, New York (1981), p. 201- 
202] . 



K-HPO. 
2 4 

Citrate trisodique 

MgS0 4 . 7H 2 0 

(NH 4 )2S0 4 

KH-PO. 
2 4 

Glycerol 



12,6 g 
0,9 g 
0,18 g 
1,8 g 
3,6 g 

88 g 




complement ail 
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B, Vecteurs d' expression 

Afin d'obtenir une stabilite accrue de l'ADNc com- 
plet, on a modifi§ le vecteur d' expression pBSTAcIIr 
d' ovocytes pour reduire le nombre de copies de plasmides 
5 lors de la culture dans E. coli et pour reduire la pour- 
suite de la transcription a partir de sequences du vec- 
teur, qui pourrait conduire S une expression cryptique 
toxique de la proteine PN5 [Brosius J., Gene 27, 151-160 
(1984)], On a fait digerer pBSTAcIIr par PvuII. Le frag- 
0 ment de 755 pb, contenant le promoteur de T7, la 5'-UTR de 
£-globine, le site de clonage multiple, la 3'-UTR de 
0-globine et le promoteur de T3, a ete ligature avec le 
fragment de 3,6 kb contenant l'origine de replication, le 
gene de resistance a 1' ampicilline, les terminateurs de 
transcription rrnBT^ et rrnBT 1 T 2 de pKK232-8, qui avait 
Ste dig£r§ complStement par Smal .et digSrS partielleme.nt 
par PvuII et traite par de la phosphatase intestinale de 
crevette pour empecher 1' autoligature . Le plasmide resul- 
tant, dans lequel 1' orientation du fragment pBSTA etait 
telle que le promoteur de T7 fitait le plus rapprochS du 
terminateur rrnBT 1# a ete identifie par cartographie de 
restriction, est denomme pHQ8. Comme dans le cas de pBSTA, 
le sens de la transcription du gene de resistance a l'am- 
picilline et de l'origine de replication de pHQ8 est 
oppose a celui de la cassette d' expression du gSne, et la 
presence du terminateur rrnBT^ devrait reduire toute pour- 
suite de lecture restante a partir du vecteur, dans la 
cassette d' expression conduite par le promoteur de T7. 
C. Assemblage d'ADNc complet pour 1' expression 

Etant donne que pBK-CMV.26.2 comporte une deletion 
de 58 pb (correspondant aux pb 4346 a 4403 de SEQ ID n° 1) 
et que la sequence de pBK-CMV.1.18 commence au niveau de 
la pb 4180 de SEQ ID n° 1, pBK-CMV.1.18 pouvait etre uti- 
lise pour "reparer" pBK-CMV. 26 . 2 . On a mis au point une 
strategie pour assembler un ADNc complet provenant des 
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clones pBK-CMV.26.2 et pBK-CMV.1.18 en trois segments, en 
tronquant la 5'-UTR et la 3'-UTR et en introduisant des 
sites de restriction uniques aux extremites 5' et 3' dans 
le processus. 1/ extremity 5' a §te engendree par PCR a 
partir de 2 6.2, en tronquant la 5'-UTR, par incorporation 
d'un site Sail juste en amont du codon d' initiation. Le 
segment central etait un fragment de restriction provenant 
de 26.2. L'extremite 3' a Ste preparee par PCR de chevau- 
chement £ partir de 26.2 et 1.18, et incorporation d'un 
site Xbal juste en aval du codon d' arret. On a fait dige- 
rer ces segments au niveau de sites uniques de restric- 
tion, et on les a assembles dans pBSTAcIIr. Ce produit de 
construction semblait avoir une sequence correcte, mais, 
apres reclonage en tant que fragment Sall-XJbal dans 
pCIneo, on a trouve deux types d'isolats, un comportant 
une dele tion et un comportant une insertion de 8 pb. Un 
nouvel examen du clone pBSTAcIIr a montre que la sequence 
etait "mixte" dans cette region, de sorte que le clone 
devait avoir ete rearrange. On a decouvert que 1' insertion 
de 8 pb etait une repetition de l'un des membres d'une 
duplication de 8 pb dans la sequence native, formant une 
triple repetition de 8 pb dans l'isolat rearrange. De nom- 
breuses tentatives de clonage ont inevitablement donne 
naissance 3 ce rearrangement. On a utilise la PCR de che- 
vauchement pour introduire des mutations silencieuses dans 
l'une des repetitions de 8 pb, et un fragment contenant 
cette region a ete inclus lorsque la region codant pour 
PN5 a ete assemble dans HQ8, la version a faible nombre 
de copies de pBSTAcIIr, pour donner le plasmide HR-1. 
Cette sequence s'est averee etre stable (voir 
figures 5A-E, SEQ ID n° 5) . 

On a prepare le fragment de l'extremite 5' par PCR, 
en utilisant comme matrice 1'ADN de pBK-CMV.26.2 et les 
amorces 4 999 (CTTGGTCGACTCTAGATCAGGGTGAAGATGGAGGAG; site 
Sail souligne, homologie avec PN5 en italiques, correspon- 
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dant aux pb 58-77 de SEQ ID n° 1; codon d' initiation en 
gras) et 4927 ( GTCT TCTAGA TGAGGGTTC AGTCATTGTG , correspondent 
aux pb 1067 i 1047 de SEQ ID N°l) , suivie de purification en 
gel, digestion par Sail et Kpnl (site Kpnl au niveau des 
pb 1003-1008, SEQ ID n° 1) et purification en gel, 

Le fragment central de 3,1 kb a ete prepare par 
digestion de l'ADN de pBK-CMV,26.2 par Kpnl et Aatll (site 
Aatll a 4133-4138), suivie d'une purification en gel, 

Le fragment de l'extremite 3' a ete pr£par£ comme 
suit: la PGR ^ 1 ' aide des amorces 4837 ( TCTGGG AAGTTTGG AAG , 
correspondant aux pb 3613 S 3629 de SEQ ID n° 1) et 4931 
(GACCACGAAGGCTATGTTGAGG, correspondant aux pb 4239 a 4218 
de SEQ ID n° 1) sur l'ADN de pBK-CMV.26.2 en tant que 
matrice a donn6 un fragment de 0,6 kb. La PCR, a l'aide 
des amorces 4930 (CCTCAACATAGCCTTCGTGGTC, correspondant 
aux pb 4218 a 4239 de SEQ ID n° 1) et 4929 
(GTCTTCTAGATGAGGGTTC AGTCATTGTG , site Xbal souligne, homo- 
logie avec PNR en italiques, correspondant aux pb 5386 S 
5365 de SEQ ID n° 1, codon d' arret en gras) sur l'ADN de 
pBK-CMV.1.18 en tant que matrice, a donne un fragment de 
1,2 kb, introduisant un site Xbal a 7 pb du codon d'arret. 
L'extrfimitS 3' du fragment 4837-4931 complete done exacte- 
ment l'extremite 5' du fragment 4930-4929. Ces deux frag- 
ments ont 6t§ purifiis en gel, et une fraction de chaque a 
§te reunie en tant que matrice dans une reaction PCR, a 
l'aide des amorces 4928 (CAAGCCTTTGTGTTCGAC, correspondant 
aux pb 4084 a 4101 de SEQ ID n° 1) et 4929, pour donner un 
fragment de 1,3 kb. Ce fragment a 6te purifie en gel, 
digere par Aatll et Xbal, et le fragment de 1,2 kb a ete 
purifie en gel . 

Le fragment de l'extremite 3' a ete clone dans 
pBSTAcIIr digere par Aatll et Xbal. Un isolat a ete digere 
par Sail et Kpnl et ligature avec le fragment de l'extre- 
mite 5' . Le plasmide resultant, apres verification de la 
sequence, a ete digere par Kpnl et >*atll et ligature avec 
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le fragment central de 3,1 kb, pour donner pBSTAcIIr.PNS 
(clone 21). pBSTAcIIr.PNS (clone 21) a ete digere par Sail 
et Xbal, pour liberer le fragment PN5 de 5,3 kb, qui a ete 
clone dans pCIneoII digere par Sail et Xbal. On a trouve 
de multiples isolats, dont GPIl-i, qui a ete sequence com- 
pletement, etait caracteristique et contenait un insert de 
8 pb. Cet insert CAGAAGAA, aprds la pb 3994 de SEQ ID 
n° l, convertissait la repetition directe de cette 
sequence en cet emplacement en une triple repetition 
directe, provoquant un deplacement dans le cadre de lec- 
ture. Dans une tentative pour reparer ce defaut, on a fait 
digerer pBSTAcIIr.PNS (clone 21) par Nhel (pb 2538-2543, 
SEQ ID n° 1) et Xhol (pb 4828-4833, SEQ ID n 1), pour 
obtenir un fragment de 6,2 kb, et avec yiatll et Xhol, pour 
obtenir un fragment de 0,7 kb qui a ete ligature avec le 
fragment de 1,6 kb resultant de la digestion de 
pBK-CMV.26.2 par Aatll et Nhel. Bien qu'on n'ait trouve 
aucun isolat totaleraent correct, un isolat, HA-4, compor- 
tait seulement un seul changement de base, une deletion de 
la C a la pb 4827 (SEQ ID n° 1), adjacente au site Xhol. 

Afin d'eviter que se produise le rearrangement par 
insertion de 8 pb, on a introduit trois mutations silen- 
cieuses dans la repetition en 5', et deux mutations sup- 
plementaires dans une serie de T seraient egalement intro- 
duces, comme indique ci-dessous (pb 3982 $l 4014, SEQ ID 
n° 1; sites de mutation soulignes, repetitions de 8 pb 
dans la sequence native en italiques) : 

sequence native GAC ATT TTT ATG ACA GAA GAA CAG AAG AAA TAT 

Asp He Phe Met Thr Glu Glu Gin Lys Lys Tyr 
sequence mutante GAC ATC TTC ATG ACT GAG GAG CAG AAG AAA TAT 

Etant donne que 1' isolat HA-4 comportait la 
sequence repetee directe native (par opposition a, par 
exemple, pBSTAcIIr . PNS (clone 21)] et que la region voi- 
sine du defaut du site Xhol n' etait pas impliquee, on l'a 
utilise comme ADM matrice pour les reactions PCR sui- 
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vantes. 1/ amorce P5-3716S 

( CCGAAGCCAATGTAACATTAGTAATTACTCGTG , correspondant aux pb 
3684 a 3716, SEQ ID n° 1) a ete appariee avec 1' amorce 
P5-3969AS (GCTCCTCAGTCATGAAGATGTCTTGGCCACCTAAC , correspon- 
5 dant aux pb 4003 a 3969, SEQ ID n° 1, les bases mutSes 
sont soulignees) , pour donner un produit de 320 pb. 
L' amorce P5-4017S 

( GGCCAAGACATCTTCATGACTGAGGAGCAGAAGAAATATTAC , correspondant 
aux pb 3976 & 4017, SEQ ID n° 1; les bases mutSes sont 

10 soulignees) a et6 appariee avec 1' amorce P5-4247AS 

( CTCAAAGCAAAGACTTTGATGAGACACTCTATGG , correspondant aux pb 
4280 a 4247, SEQ ID n° 1), pour donner un produit de 
305 pb, L'extremite 3' du fragment de 320 pb avait done un 
segment de 28 pb correspondant exactement a l'extremite 5' 

15 <ju fragment de 305 pb. Les deux bandes ont ete purifiees 
en gel, et une fraction de chaque a ete reunie, dans une 
nouvelle reaction PCR, avec les amorces P5-3716S et 
P5-4247AS, pour donner un produit de 597 pb, qui a ete 
clone T/A dans le vecteur pCRII. On a trouve l'isolat 

20 HO-7, qui avait la sequence recherchee. On a effectue une 
quadruple ligature pour assembler le PN5 modifie complet: 

On a fait digerer par Sail et Xbal le vecteur d' ex- 
pression HQ- 8 dans des ovocytes, pour obtenir un fragment 
vecteur de 4,4 kb, GPII-1; on a fait digerer GPII-1 par 

25 sail et Wlul, pour obtenir un fragment de 3,8 kb contenant 
la moitie 5' de PN5; on a fait digerer HO-7 par tflul (pb 
3866 a 3871, SEQ ID n° 1) et ylatll, pour obtenir un frag- 
ment de 0,3 kb contenant la region repetee de 8 pb mutante 
de PN5; on a fait digerer GPII-1 par Aatll et Xbal, pour 

30 obtenir le segment 3' restant de 1,3 kb de PN5 . Une partie 
du melange reactionnel de ligature a ete transforme dans 
des cellules Stable 2 de JET. coli, Parmi les isolats de 
9,6 kb contenant tous les quatre fragments, HR-1 a ete 
sequence et s'est revele comporter la sequence de 5,4 kb 

35 recherchee. Ces isolats se developpaient bien et ne mani- 
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festaient pas de tendance au r§arrangement . La sequence de 
cette version construite de PN5 est representee sur les 
figures 5A-E (SEQ ID n° 5) . 

EXEMPLE 8 

PNR humain 

On a isolS un clone de 856 pb (figure 3A, SEQ ID 
n° 3) £ partir d'une banque d'ADNc de ganglions de la 
racine dorsale (GRD) humains, qui est trSs etroitement 
apparent^ a PN5 de rat, avec une identity de 79 % en ce 
qui concerne la sequence d' aminoacides . La sequence de 
PN5 humain couvre la region entre IIIS1 et 1' interdomaine 
III/IV, qui comprend la vanne d' inactivation rapide (a 
savoir IFM) , qui est localisee dans 1' interdomaine III/IV. 

On a construit la banque d'ADNc de GRD & partir 
d'ARN total de GRD 4 et 5 lombaires qui etait amorce au 
hasard. L' ADNc du p remier brin a ete synthetise a l'aide 
de transcriptase inverse Superscript II (GIBCO BRL) , et la 
synthese du second brin a ete effectuee a l'aide d'ADN 
polymerase de T4 . Des segments de raccord EcoRI ont ete 
ligatures avec les extremites des ADNc double brin, et les 
fragments ont ete clones dans le vecteur ZAP II 
(Stratagene) . La banque a et6 criblee a l'aide de PN3 de 
rat marque a la digoxigenine, PN1 de rat et des sondes hHl 
de coeur humain. Les clones positifs ont ete sequences et 
compares a des sequences connues de canaux sodiques 
humains et de rat. Seul le clone precite a ete identifie 



en tant que sequence de PN5 humain. 

Canal % de similarite % d'identite 

Cerveau humain (HBA) 76 69 

Coeur humain (hHl) 81 74 

Coeur atypique humain 60 52 

Muscle squelettique humain 80 71 

Neuroendocrine humaine 78 71 

PN3 humain 77 70 

PN1 de rat 79 72 
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Canal % de similarity % d'identite 

PN3 de rat 78 71 

PN4 de rat 78 70 

PNS de rat 86 79 

La figure 3B compare la sequence d'aminoacides du 
fragment hPN5 avec la sequence d'aminoacides de PN5 de 
rat, dans la region appropriee. 

EXEMPLE 9 

Distribution tissulaire par RT-PCR 

On a isolS £ partir de rats Sprague-Dawley males 
adultes normaux, anesthesi§s, des tissus de cerveau, de 
moelle epiniere, de GRD, de ganglions plexiformes, de gan- 
glions cervicaux superieurs, de nerf sciatique, de coeur 
et de muscle squelettique, et on les a conserves a -80°C. 
On a isole l'ARN de chaque tissu a l'aide de RNAzol (Tel- 
Test Inc.). L'ADNc amorcS au hasard a ete transcrit par 
transcription inverse a partir de 500 mg d'ARN provenant 
de chaque tissu. 1/ amorce directe 
( CAGATTGTGTTCTCAGTACATTCC ) et 1' amorce inverse 
(CCAGGTGTCTAACGAATAAATAGG) ont ete concpues Sl partir de la 
region non traduite en 3', pour dormer un fragment de 
252 paires de bases. Les parametres de cycle etaient 
94°C/2 minutes (denaturation) , 94°C/30 s, 65°C/30 s et 
72°C/1 min (35 cycles) et 72°C/4 min. Les produits de 
reaction ont et£ analyses sur un gel d' agarose a 4 %. 

Un temoin positif et un temoin sans matrice ont ete 
egalement inclus. On a £galement amplifie par pCR de 
l'ADNc provenant de chaque tissu, en utilisant des amorces 
specif iques de la glyceraldehyde-3 -phosphate dehydroge- 
nase, pour montrer la viabilite de la matrice, comme decrit 
par Tso et coll., Nucleic. Acid Res. 13, 2485-2502 (1985). 

Le profil de distribution tissulaire de rPM5 par 
analyse par RT-PCR d'ARN provenant de tissus choisis de 
rat, etait le suivant: 
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Tissu 



RT-PCR (35 cycles) 



Cerveau 



+ 



Moelle Spinidre 
GRD 

Ganglions plexi formes 
Ganglions cervicaux superieurs 



+ 



++ + 



Nerf sciatique 
Coeur 

Muscle squelettique 

Fll non trait§ + 
Fll traite + 

PN5 a ete egalement detecte apres seulement 

25 cycles (24 + 1) dans les memes cinq tissus que ci- 

dessus, en la meme abondance relative. 



gue avec KLH et l'anticorps a ete suscite chez des lapins. 
1/ antiserum a ete ensuite purifie par af finite, PN5 con- 
stitue une sous-famille de nouveaux genes de canaux 
sodiques; ces gdnes sont differents de ceux detectables 
avec d'autres sondes (par exemple les sondes PEAF8 et 
PN3) . 

II doit etre bien entendu que la description qui 
precede n'a 6t6 donnee qu'& titre illustratif et non limi- 
tatif et que toutes variantes ou modifications peuvent y 
etre apportees sans sortir pour autant du cadre general de 
presente invention, tel que defini dans les revendications 
ci-annexees . 
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LISTE DES SEQUENCES 
INFORMATIONS GENERALES : 
(I) DEMANDERESSE : 

(A) NOM: P. HOFFMANN-LA ROCHE AG 

(B) RUE: Grenzacherstrasse 124 

(C) VILLE: BSle 

(D) ETAT: BS 

(E) PAYS: Suisse 

(F) CODE POSTAL: CH-4010 

(G) TELEPHONE: 061-6884256 

(H) TELECOPIEUR : 061-6881395 

(I) TELEX: 962292/965542 hlr ch 

(II) TITRE DE L' INVENTION: Sequence d'ADN codant pour 
une proteine de canal sodique, sa production et 
son utilisation 
(III) NOMBRE DES SEQUENCES: 5 

(IV) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: disque souple 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS /MS-DOS 

(D) LOGICIEL: Patentln Release n° 1.0, version 
1.30 

INFORMATIONS POUR SEQ ID n° 1: 

(I) CARACTERISTIQUES DE LA SEQUENCE:' 

(A) LONGUEUR: 5 908 paires de bases 

(B) TYPE: acide nucleique 

(C) TYPE DE BRIN: simple 

(D) TOPOLOGIE: lineaire 
(II) TYPE DE MOLECULE: ADNc 

(III) HYPOTHETIQUE : non 
(IV) ANTISENS: non 
(VI) SOURCE D'ORIGINE: 

(A) ORGANISME: rat 

(B) TYPE DE TISSU: ganglions de la racine dor- 
sale 
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(C) TYPE DE CELLULE: nerf pSripherique 
(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID n' 1: 



5 



20 



25 



1 


GAAGTCACAG 


GAGTGTCTGT 


CAGCGAGAGG 


AAGAAGGGAG 


AGTTTACTGA 


51 


GTGTCTTCTG 


CCCCTCCTCA 


GGGTGAAGAT 


GGAGGAGAGG 


TACTACCCGG 


101 


TGATCTTCCC 


GGACGAGCGG 


AATTTCCGCC 


CCTTCACTTC 


CGACTCTCTG 


151 


GCTGCCATAG 


AGAAGCGGAT 


TGCTATCCAA 


AAGGAGAGGA 


AGAAGTCCAA 


201 


AGACAAGGCG 


GCAGCTGAGC 


CCCAGCCTCG 


GCCTCAGCTT 


GACCTAAAGG 


251 


CCTCCAGGAA 


GTTACCTAAG 


CTTTATGGTG 


ACATTCCCCC 


TGAGCTTGTA 


301 


GCGAAGCCTC 


TGGAAGACCT 


GGACCCATTC 


TACAAAGACC 


ATAAGACATT 


351 


CATGGTGTTG 


AACAAGAAGA 


GAACAATTTA 


TCGCTTCAGC 


GCCAAGCGGG 


401 


CCTTGTTCAT 


TCTGGGGCCT 


TTTAATCCCC 


TCAGAAGCTT 


AATGATTCGT 


451 


ATCTCTGTCC 


ATTCAGTCTT 


TAGCATGTTC 


ATCATCTGCA 


CGGTGATCAT 


501 


caactgtAtg 


TTCATGGCGA 


ATTCTATGGA 


GAGAAGTTTC 


GACAACGACA 


551 


TTCCCGAATA 


CGTCTTCATT 


GGGATTTATA 


TTTTAGAAGC 


TGTGATTAAA 


601 


ATATTGGCAA 


GAGGCTTCAT 


TGTGGATGAG 


TTTTCCTTCC 


TCCGAGATCC 


651 


GTGGAACTGG 


CTGGACTTCA 


TTGTCATTGG 


AACAGCGATC 


GCAACTTGTT 


701 


TTCCGGGCAG 


CCAAGTCAAT 


CTTTCAGCTC 


TTCGTACCTT 


CCGAGTGTTC 


751 


AGAGCTCTGA 


AGGCGATTTC 


AGTTATCTCA 


GGTCTGAAGG 


TCATCGTAGG 


801 


TGCCCTGCTG 


CGCTCGGTGA 


AGAAGCTGGT 


AGACGTGATG 


GTCCTCACTC 


851 


TCTTCTGCCT 


CAGCATCTTT 


GCCCTGGTCG 


GTCAGCAGCT 


GTTCATGGGA 


901 


ATTCTGAACC 


AGAAGTGTAT 


TAAGCACAAC 


TGTGGCCCCA 


ACCCTGCATC 


951 


CAACAAGGAT 


TGCTTTGAAA 


AGGAAAAAGA 


TAGCGAAGAC 


TTCATAATGT 


1001 


GTGGTACCTG 


GCTCGGCAGC 


AGACCCTGTC 


CCAATGGTTC 


TACGTGCGAT 


1051 


AAAACCACAT 


TGAACCCAGA 


CAATAATTAT 


ACAAAGTTTG 


ACAACTTTGG 


1101 


CTGGTCCTTT 


CTCGCCATGT 


TCCGGGTTAT 


GACTCAAGAC 


TCCTGGGAGA 


1151 


GGCTTTACCG 


ACAGATCCTG 


CGGACCTCTG 


GGATCTACTT 


TGTCTTCTTC 



35 
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25 



30 



35 



1201 


TTCGTGGTGG TCATCTTCCT GGGCTCCTTC 


TACCTGCTTA 


ACCTAACCCT 


1251 


GGCTGTTGTC 


ACCATGGCTT 


ATGAAGAACA 


GAACAGAAAT 


GTAGCTGCTG 


1301 


AGACAGAGGC 


CAAGGAGAAA 


ATGTTTCAGG 


AAGCCCAGCA 


GCTGTTAAGG 


1351 


GAGGAGAAGG 


AGGCTCTGGT 


TGCCATGGGA 


ATTGACAGAA 


GTTCCCTTAA 


1401 


TTCCCTTCAA 


GCTTCATCCT 


TTTCCCCGAA 


GAAGAGGAAG 


TTTTTCGGTA 


1451 


GTAAGACAAG 


AAAGTCCTTC 


TTTATGAGAG 


GGTCCAAGAC 


GGCCCAAGCC 


1501 


TCAGCGTCTG 


ATTCAGAGGA 


CGATGCCTCT 


AAAAATCCAC 


AGCTCCTTGA 


1551 


GCAGACCAAA 


CGACTGTCCC 


AGAACTTGCC 


AGTGGATCTC 


TTTGATGAGC 


1601 


ACGTGGACCC 


CCTCCACAGG 


CAGAGAGCGC 


TGAGCGCTGT 


CAGTATCTTA 


1651 


ACCATCACCA 


TGCAGGAACA 


AGAAAAATTC 


CAGGAGCCTT 


GTTTCCCATG 


1701 


TGGGAAAAAT 


TTGGCCTCTA 


AGTACCTGGT 


GTGGGACTGT 


AGCCCTCAGT 


1751 


GGCTGTGCAT 


AAAGAAGGTC 


CTGCGGACCA 


TCATGACGGA 


TCCCTTTACT 


1801 


GAGCTGGCCA 


TCACCATCTG 


CATCATCATC 


AATACCGTTT 


TCTTAGCCGT 


1851 


GGAGCACCAC 


AACATGGATG 


ACAACTTAAA 


GACCATACTG 


AAAATAGGAA 


1901 


ACTGGGTTTT 


CACGGGAATT 


TTCATAGCGG 


AAATGTGTCT 


CAAGATCATC 


1951 


GCGCTCGACC 


CTTACCACTA 


CTTCCGGCAC 


GGCTGGAATG 


TTTTTGACAG 


2001 


CATCGTGGCC 


CTCCTGAGTC 


TCGCTGATGT 


GCTCTACAAC 


ACACTGTCTG 


2051 


ATAACAATAG 


GTCTTTCTTG 


GCTTCCCTCA 


GAGTGCTGAG 


GGTCTTCAAG 


2101 


TTAGCCAAAT 


CCTGGCCCAC 


GTTAAACACT 


CTCATTAAGA 


TCATCGGCCA 


2151 


CTCCGTGGGC 


GCGCTTGGAA 


ACCTGACTGT 


GGTCCTGACT 


ATCGTGGTCT 


2201 


TCATCTTTTC 


TGTGGTGGGC 


ATGCGGCTCT 


TCGGCACCAA 


GTTTAACAAG 


2251 


ACCGCCTACG 


CCACCCAGGA 


GCGGCCCAGG 


CGGCGCTGGC 


ACATGGATAA 


2301 


TTTCTACCAC 


TCCTTCCTGG 


TGGTGTTCCG 


CATCCTCTGT 


GGGGAATGGA 


2351 


TCGAGAACAT 


GTGGGGCTGC 


ATGCAGGATA 


TGGACGGCTC 


CCCGTTGTGC 


2401 


ATCATTGTCT 


TTGTCCTGAT 


AATGGTGATC 


GGGAAGCTTG 


TGGTGCTTAA 


2451 


CCTCTTCATT 


GCCTTGCTGC 


TCAATTCCTT 


CAGCAATGAG 


GAGAAGGATG 
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2501 GGAGCCTGGA AGGAGAGACC AGGAAAACCA AAGTGCAGCT AGCCCTGGAT 
2551 CGGTTCCGCC GGGCCTTCTC CTTCATGCTG CACGCTCTTC AGAGTTTTTG 
2601 TTGCAAGAAA TGCAGGAGGA AAAACTCGCC AAAGCCAAAA GAGACAACAG 
2651 AAAGCTTTGC TGGTGAGAAT AAAGACTCAA TCCTCCCGGA TGCGAGGCCC 
2701 TGGAAGGAGT ATGATACAGA CATGGCTTTG TACACTGGAC AGGCCGGGGC 
2751 TCCGCTGGCC CCACTCGCAG AGGTAGAGGA CGATGTGGAA TATTGTGGTG 
2801 AAGGCGGTGC CCTACCCACC TCACAACATA GTGCTGGAGT TCAGGCCGGT 
2851 GACCTCCCTC CAGAGACCAA GCAGCTCACT AGCCCGGATG ACCAAGGGGT 
2901 TGAAATGGAA GTATTTTCTG AAGAAGATCT GCATTTAAGC ATACAGAGTC 
2951 CTCGAAAGAA GTCTGACGCA GTGAGCATGC TCTCGGAATG CAGCACAATT 
3001 GACCTGAATG ATATCTTTAG AAATTTACAG AAAACAGTTT CCCCCAAAAA 
3051 GCAGCCAGAT AGATGCTTTC CCAAGGGCCT TAGTTGTCAC. ..TOCTATGCC 
3101 ACAAAACAGA CAAGAGAAAG TCCCCCTGGG TCCTGTGGTG GAACATTCGG 
3151 AAAACCTGCT ACCAAATCGT GAAGCACAGC TGGTTTGAGA GTTTCATAAT 
3201 CTTTGTTATT CTGCTGAGCA GTGGAGCGCT GATATTTGAA GATGTCAATC 
3251 TCCCCAGCCG GCCCCAAGTT GAGAAATTAC TAAGGTGTAC CGATAATATT 
3301 TTCACATTTA TTTTCCTCCT GGAAATGATC CTGAAGTGGG TGGCCTTTGG 
3351 ATTCCGGAGG TATTTCACCA GTGCCTGGTG CTGGCTTGAT TTCCTCATTG 
3401 TGGTGGTGTC TGTGCTCAGT CTCATGAATC TACCAAGCTT GAAGTCCTTC 
3451 CGGACTCTGC GGGCCCTGAG ACCTCTGCGG GCGCTGTCCC AGTTTGAAGG 
3501 AATGAAGGTT GTCGTCTACG CCCTGATCAG CGCCATACCT GCCATTCTCA 
3551 ATGTCTTGCT GGTCTGCCTC ATTTTCTGGC TCGTATTTTG TATCTTGGGA 
3601 GTAAATTTAT TTTCTGGGAA GTTTGGAAGG TGCATTAACG GGACAGACAT 
3 651 AAATATGTAT TTGGATTTTA CCGAAGTTCC GAACCGAAGC CAATGTAACA 
3701 TTAGTAATTA CTCGTGGAAG GTCCCGCAGG TCAACTTTGA CAACGTGGGG 
3 751 AATGCCTATC TCGCCCTGCT GCAAGTGGCA ACCTATAAGG GCTGGCTGGA 



2771103 



- 45 - 



3801 


AATCATGAAT 


GCTGCTGTCG 


ATTCCAGAGA 


GAAAGACGAG 


CAGCCGGACT 


3851 


TTGAGGCGAA 


CCTCTACGCG 


TATCTCTACT 


TTGTGGTTTT 


TATCATCTTC 


3901 


GGCTCCTTCT 


TTACCCTGAA 


CCTCTTTATC 


GGTGTTATTA 


TTGACAACTT 


3951 


CAATCAGCAG 


CAGAAAAAGT 


TAGGTGGCCA 


AGACATTTTT 


ATGACAGAAG 


4001 


AACAGAAGAA 


ATATTACAAT 


GCAATGAAAA 


AGTTAGGAAC 


CAAGAAACCT 


4051 


CAAAAGCCCA 


TCCCAAGGCC 


CCTGAACAAA 


TGTCAAGCCT 


TTGTGTTCGA 


4101 


CCTGGTCACA 


AGCCAGGTCT 


TTGACGTCAT 


CATTCTGGGT 


CTTATTGTCT 


4151 


TAAATATGAT 


TATCATGATG 


GCTGAATCTG 


CCGACCAGCC 


CAAAGATGTG 


4201 


AAGAAAACCT 


TTGATATCCT 


CAACATAGCC 


TTCGTGGTCA 


TCTTTACCAT 


4251 


AGAGTGTCTC 


ATCAAAGTCT 


TTGCTTTGAG 


GCAACACTAC 


TTCACCAATG 


4301 


GCTGGAACTT 


ATTTGATTGT 


GTGGTCGTGG 


TTCTTTCTAT 


CATTAGTACC 


4351 


CTGGTTTCCC 


GCTTGGAGGA 


CAGTGACATT 


TCTTTCCCGC 


CCACGCTCTT 


4401 


CAGAGTCGTC 


CGCTTGGCTC 


GGATTGGTCG 


AATCCTCAGG 


CTGGTCCGGG 


4451 


CTGCCCGGGG 


AATCAGGACC 


CTCCTCTTTG 


CTTTGATGAT 


GTCTCTCCCC 


4501 


TCTCTCTTCA 


ACATCGGTCT 


GCTGCTCTTC 


CTGGTGATGT' 


TCATTTACGC 


4551 


CATCTTTGGG 


ATGAGCTGGT 


TTTCCAAAGT 


GAAGAAGGGC 


TCCGGGATCG 


4601 


ACGACATCTT 


CAACTTCGAG 


ACCTTTACGG 


GCAGCATGCT 


GTGCCTCTTC 


4651 


CAGATAACCA 


CTTCGGCTGG 


CTGGGATACC 


CTCCTCAACC 


CCATGCTGGA 


4701 


GGCAAAAGAA 


CACTGCAACT 


CCTCCTCCCA 


AGACAGCTGT 


CAGCAGCCGC 


4751 


AGATAGCCGT 


CGTCTACTTC 


GTCAGTTACA 


TCATCATCTC 


CTTCCTCATC 


4801 


GTGGTCAACA 


TGTACATCGC 


TGTGATCCTC 


GAGAACTTCA 


ACACAGCCAC 


4851 


GGAGGAGAGC 


GAGGACCCTC TGGGAGAGGA CGACTTTGAA 


ATCTTCTATG 


4901 


AGGTCTGGGA 


GAAGTTTGAC 


CCCGAGGCGT 


CGCAGTTCAT 


CCAGTATTCG 


4951 


GCCCTCTCTG 


ACTTTGCGGA 


CGCCCTGCCG 


GAGCCGTTGC 


GTGTGGCCAA 


5001 


GCCGAATAAG 


TTTCAGTTTC 


TAGTGATGGA 


CTTGCCCATG 


GTGATGGGCG 


5051 


ACCGCCTCCA 


TTGCATGGAT 


GTTCTCTTTG 


CTTTCACTAC 


CAGGGTCCTC 
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J ± U JL 


f5(5GG APTfT A 


GCGGCTTGGA 


TAPPATPAAA 


appatpatpp 


A G G A G A A P TT 


J X J ± 


TATGGAGGCC 


AAPPPTTTTA 

v» a a a a r* 


AGAAGCTCTA 


PGAGPPPATA 


PTPAPPAPPA 


5201 


CCAAGAGGAA 


GGAGGAGGAG 


CAAGGCGCCG 


PPGTPATPPA 


G AGGGCCT AP 


5251 


CGGAAACACA 


TGGAGAAGAT 


GGTCAAACTG 


AnrspTp a agg 


APAPPTPA AP 


5301 


TTCATCGCAC 


CAGGTGTTTT 


GCAATGGAGA 


PTTPTPPAPP 


TTPP ATPTPP 


5351 


CCAAGGTCAA GGTTCACAAT GACTGAACCC 


TP 2k TP TP P & P 


pppti\pptp h 


5401 


CTGCCTCACA 


GCTTAGCCTC 


CAGCCTCTGG 


UuAGL»AljoLG 


GL.AGAG i LAC 




TGAACACAGG 


CCGTTCGATC 


TGTGTTTTTG 


GL X G AAL.G AG 


G 1GALAGGTT 


JJVi 


GGCGTCCATT 


TTTAAATGAC 


TCTTGGAAAG 


ATTTCATGTA 


GAGAGATGTT 




AGAAGGGACT 


GCAAAGGACA 


CCGACCATAA 


CGGAAGGCCT 


GGAGGACAGT 


5601 


CCAACTTACA 


TAAAGATGAG 


AAACAAGAAG 


PA A AP ATPPP 


aggaaaag i r 




CAGATTGTGT 


TCTCAGTACA 


TCCCCCAATG 


T f 'P f T^T* 

iolLibl 1 Lb 


GTGTiTTGAG 




TATGTGACCT 


GCCACATGTA 


GCTCTTTTTT 


GCATGTACG 1 


CAAAACCCTG 


5751 


CAGTAAGTTG 


ATAGCTTGCT 


ACGGGTGTTC 


CTACCAGCAT 


CACAGAATTG 


5801 


GGTGTATGAC 


TCAAACCTAA 


AAGCATGACT 


CTGACTTGTC 


AGTCAGCACC 


5851 


CCGACTTTCA 


GACGCTCCAA 


TCTCTGTCCC 


AGGTGTCTAA 
s 


CGAATAAATA 


5901 


GGTAAAAG 










(3) INFORMATIONS 


POUR SEQ ID 


n° 2: 







(I) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1 765 aminoacides 

(B) TYPE: aminoacide 

(C) TYPE DE BRIN: - 

(D) T0P0L0GIE: sans rapport 
(II) TYPE DE MOLECULE: proteine 

(III) HYPOTHETIQUE : oui 
(VI) SOURCE D'ORIGINE: 

(A) ORGANISME: rat 

(B) TYPE DE TISSU: ganglions de la racine dor- 
sale 

(C) TYPE DE CELLULE : nerf peripherique 
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(XI) DESCRIPTION OB LA SEQUENCE: SEQ ID n" 2: 
Met Glu Glu Arg Tyr Tyr Pro Val lie Phe Pro Asp Glu Axg Asn Phe 
1 5" 10 15 

Arg Pro Phe Thr Ser Asp Ser Leu Ala Ala lie Glu Lys Arg He Ala 

20 25 30 

He Gin Lys Glu Arg Lys Lys Ser Lys Asp Lys Ala Ala Ala Glu Pro 

35 40 45 

Gin Pro Arg Pro Gin Leu Asp Leu Lys Ala Ser Arg Lys Leu Pro Lys 

50 55 60 

Leu Tyr Gly Asp He Pro Pro Glu Leu Val Ala Lys Pro Leu Glu Asp 
65 70 75 80 

Leu Asp Pro Phe Tyr Lys Asp His Lys Thr Phe Met Val Leu Asn Lys 

85 90 05 

Lys Arg Thr He Tyr Arg Phe Ser Ala Lys Arg Ala Leu Phe He Leu 
100 105 no 

Gly Pro Phe Asn Pro Leu Arg Ser Leu Met He Arg He Ser Val His. 

115 120 m 

Ser Val Phe Ser Mec Phe He He Cys Thr Val He He Asn Cys Mec 

130 135 i 4 o 

Phe Met Ala Asn Ser Mec Glu Arg Ser Phe Asp Asn Asp He Pro Glu 
145 150 155 160 

Tyr Val Phe He Gly He Tyr He Leu Glu Ala Val He Lys He Leu 

365 170 175 

Ala Arg Gly Phe He Val Asp Glu Phe Ser Phe Leu Arg Asp Pro Trp 

380 las 19Q 

Asn Trp Leu Asp Phe He Val He Gly Thr Ala He Ala Thr Cys Phe 

195 200 205 

Pro Gly Ser Gin Val Asn Leu Ser Ala Leu Arg Thr Phe Arg Val Phe 

210 215 220 

Arg Ala Leu Lys Ala He Ser Val He Ser Gly Leu Lys Val He Val 
225 230 235 240 

Gly Ala Leu Leu Arg Ser Val Lys Lys Leu Val Asp Val Mec Val Leu 
245 250 



255 

Leu Val Gly Gin Gin L 

260 265 



Thr Leu Phe Cys Leu Ser He Phe Ala Leu Val Gly Gin Gin Leu Phe 



270 
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Met Gly lie Leu Asn Gin Lys Cys lie Lys His Asn Cys Gly Pro Asn 

275 280 285 

Pro Ala Ser Asn Lys Asp Cys Phe Glu Lys Glu Lys Asp Ser Glu Asp 

290 295 300 

Phe lie Met Cys Gly Thr Trp Leu Gly Ser Arg Pro Cys Pro Asn Gly 
305 310 315 320 

Ser Thr Cys Asp Lys Thr Thr Leu Asn Pro Asp Asn Asn Tyr Thr Lys 

325 330 335 

Phe Asp Asn Phe Gly Trp Ser Phe Leu Ala Met Phe Arg Val Met Thr 

340 345 350 

Gin Asp Ser Trp Glu Arg Leu Tyr Arg Gin He Leu Arg Thr Ser Gly 

355 360 365 

He Tyr Phe Val Phe Phe Phe Val Val Val He Phe Leu Gly Ser Phe 

370 375 380 

Tyr Leu Leu Asn Leu Thr Leu Ala Val Val Thr Met Ala Tyr Glu Glu 

385 390 395 4 00 

Gin Asn Arg Asn Val Ala Ala Glu Thr Glu Ala Lys Glu Lys Met Phe 

405 410 '" 415 

Gin Glu Ala Gin Gin Leu Leu Arg Glu Glu Lys Glu Ala Leu Val Ala 

420 425 430 

Met Gly He Asp Arg Ser Ser Leu Asn Ser Leu Gin Ala Ser Ser Phe 

435 440 445 

Ser Pro Lys Lys Arg Lys Phe Phe Gly Ser Lys Thr Arg Lys Ser Phe 

450 455 460 

Phe Met Arg Gly Ser Lys Thr Ala Gin Ala Ser Ala Ser Asp Ser Glu 
465 470 475 480 

Asp Asp Ala Ser Lys Asn Pro Gin Leu Leu Glu Gin Thr Lys Arg Leu 

485 490 495 

Ser Gin Asn Leu Pro Val Asp Leu Phe Asp Glu His Val Asp Pro Leu 

500 505 510 

His Arg Gin Arg Ala Leu Ser Ala Val Ser He Leu Thr He Thr Met 

515 520 525 

Gin Glu Gin Glu Lys Phe Gin Glu Pro Cys Phe Pro Cys Gly Lys Asn 
530 535 540 
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Leu Ala Ser Lys Tyr Leu Val Trp Asp Cys Ser Pro Gin Trp Leu Cys 
545 550 555 560 

lie Lys Lys Val Leu Arg Thr lie Met Thr Asp Pro Phe Thr Glu Leu 

565 570 575 

Ala He Thr He Cys He He He Asn Thr Val Phe Leu Ala Val Glu 

580 585 590 

His His Asn Met Asp Asp Asn Leu Lys Thr He Leu Lys He Gly Asn 

595 600 605 

Trp Val Phe Thr Gly He Phe He Ala Glu Met Cys Leu Lys He He 

610 615 620 

Ala Leu Asp Pro Tyr His Tyr Phe Arg His Gly Trp Asn Val Phe Asp 
625 630 635 640 

Ser He Val Ala Leu Leu Ser Leu Ala Asp Val Leu Tyr Asn Thr Leu 

645 650 655 

Ser Asp Asn Asn Arg Ser Phe Leu Ala Ser Leu Arg Val Leu Arg Val 
660 665 670 



Phe Lys Leu Ala Lys Ser Trp Pro Thr Leu Asn Thr Leu He Lys He 

675 680 685 

He Gly His Ser Val Gly Ala Leu Gly Asn Leu Thr Val Val Leu Thr 
690 695 700 



He Val Val Phe He Phe Ser Val Val Gly Met Arg Leu Phe Gly Thr 
705 710 715 720 

Lys Phe Asn Lys Thr Ala Tyr Ala Thr Gin Glu Arg Pro Arg Arg Arg 

725 730 735 

Trp His Met Asp Asn Phe Tyr His Ser Phe Leu Val Val Phe Arg He 

740 745 750 

Leu Cys Gly Glu Trp He Glu Asn Met Trp Gly Cys Met Gin Asp Met 

755 760 765 

Asp Gly Ser Pro Leu Cys He He Val Phe Val Leu He Met Val He 

770 775 780 

Gly Lys Leu Val Val Leu Asn Leu Phe He Ala Leu Leu Leu Asn Ser 
735 790 795 800 

Phe Ser Asn Glu Glu Lys Asp Gly Ser Leu Glu Gly Glu Thr Arg Lys 
805 810 815 
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Thr Lys Val Gin 



Leu 



Ala 



Leu Asp 



Arg Phe Arg 



Arg Ala 



Phe Ser Phe 



820 



825 



830 



10 



15 



20 



25 



Met Leu His Ala Leu Gin Ser Phe Cys Cys Lys Lys Cys Arg Arg Lys 

835 840 845 

Asn Ser Pro Lys Pro Lys Glu Thr Thr Glu Ser Phe Ala Gly Glu Asn 

850 855 860 

Lys Asp Ser He Leu Pro Asp Ala Arg Pro Trp Lys Glu Tyr Asp Thr 
865 870 875 880 

Asp Met Ala Leu Tyr Thr Gly Gin Ala Gly Ala Pro Leu Ala Pro Leu 

885 890 895 

Ala. Glu Val Glu Asp Asp Val Glu Tyr Cys Gly Glu Gly Gly Ala Leu 

900 905 910 

Pro Thr Ser Gin His Ser Ala Gly Val Gin Ala Gly Asp Leu Pro Pro 

915 920 925 

Glu Thr Lys Gin Leu Thr Ser Pro Asp Asp Gin Gly Val Glu Met Glu 

930 935 940 

Val Phe Ser Glu Glu Asp Leu His Leu Ser He Gin Ser Pro Arg Lys 
945 950 955 960 

Lys Ser Asp Ala Val Ser Met Leu Ser Glu Cys Ser Thr He Asp Leu 

965 970 975 

Asn Asp He Phe Arg Asn Leu Gin Lys Thr Val Ser Pro Lys Lys Gin 

980 985 990 

Pro Asp Arg Cys Phe Pro Lys Gly Leu Ser Cys His Phe Leu Cys His 

995 1000 1005 

Lys Thr Asp Lys Arg Lys Ser Pro Trp Val Leu Trp Trp Asn He Arg 

1010 1015 1020 

Lys Thr Cys Tyr Gin He Val Lys His Ser Trp Phe Glu Ser Phe He 
1025 1030 1035 104( 

He Phe Val He Leu Leu Ser Ser Gly Ala Leu He Phe Glu Asp Val 

1045 1050 1055 

Asn Leu Pro Ser Arg Pro Gin Val Glu Lys Leu Leu Arg Cys Thr Asp 

1060 1065 1070 

Asn He Phe Thr Phe He Phe Leu Leu Glu Met He Leu Lys Trp Val 



1075 



1080 



1085 
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Ala Phe Gly Phe- Arg- Arg Tyr Phe Thr Ser Ala Trp Cys Trp Leu Asp 

1090 1095 1100 

Phe Leu lie Val Val Val Ser Val Leu Ser Leu Met Asn Leu Pro Ser 
1105 1110 1115 1120 

Leu Lys Ser Phe Arg Thr Leu Arg Ala Leu Arg Pro Leu Arg Ala Leu 

1125 1130 U35 

Ser Gin Phe Glu Gly Met Lys Val Val Val Tyr Ala Leu He Ser Ala 

1140 1145 1150 

He Pro Ala He Leu Asn Val Leu Leu Val Cys Leu He Phe Trp Leu 

1155 1160 1165 

Val Phe Cys He Leu Gly Val Asn Leu Phe Ser Gly Lys Phe Gly Arg 

1170 1175 1180 

Cys He Asn Gly Thr Asp lie Asn Met Tyr Leu Asp Phe Thr Glu Val 
1185 1190 1195 1200 

Pro Asn Arg Ser Gin Cys Asn He Ser Asn Tyr Ser Trp Lys Val Pro 

1205 1210 1215 

Gin Val Asn Phe Asp Asn Val Gly Asn Ala Tyr Leu Ala Leu Leu Gin 

1220 1225 1230 

Val Ala Thr Tyr Lys Gly Trp Leu Glu He Met Asn Ala Ala Val Asp 

1235 1240 1245 

Ser Arg Glu Lys Asp Glu Gin Pro Asp Phe Glu Ala Asn Leu Tyr Ala 

1250 1255 1260 

Tyr Leu Tyr Phe Val Val Phe He He Phe Gly Ser Phe Phe Thr Leu 
1265 1270 1275 1280 

Asn Leu Phe He Gly Val He He Asp Asn Phe Asn Gin Gin Gin Lys 
1285 1290 1295 



Lys Leu Gly Gly Gin Asp He Phe Met Thr Glu Glu Gin Lys Lys Tyr 

1300 1305 1310 

Tyr Asn Ala Met Lys Lys Leu Gly Thr Lys Lys Pro Gin Lys Pro He 
30 1315 1320 1325 

Pro Arg Pro Leu Asn Lys Cys Gin Ala Phe Val Phe Asp Leu Val Thr 

1330 1335 1340 

Ser Gin Val Phe Asp Val He He Leu Gly Leu He Val Leu Asn Met 
1345 1350 1355 1360 
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lie lie Met Met Ala Glu Ser Ala Asp Gin Pro Lys Asp Val Lys Lys 

1365 1370 1375 

Thr Phe Asp lie Leu Asn lie Ala Phe Val Val lie Phe Thr lie Glu 

1380 1385 1390 

Cys Leu lie Lys Val Phe Ala Leu Arg Gin His Tyr Phe Thr Asn Gly 

1395 1400 1405 

Trp Asn Leu Phe Asp Cys Val Val Val Val Leu Ser He He Ser Thr 

1410 1415 1420 

Leu Val Ser Arg Leu Glu Asp Ser Asp He Ser Phe Pro Pro Thr Leu 
1425 1430 1435 1440 

Phe Arg Val Val Arg Leu Ala Arg He Gly Arg He Leu Arg Leu Val 

1445 1450 1455 

Arg Ala Ala Arg Gly lie Arg Thr Leu Leu Phe Ala Leu Met Met Ser 

1460 1465 1470 

Leu Pro Ser Leu Phe Asn He Gly Leu Leu Leu Phe Leu Val Met Phe 

1475 1480 1485 

He Tyr Ala lie Phe Gly tlet Ser Trp Phe Ser Lys Val Lys Lys Gly 

1490 1495 1500 

Ser Gly He Asp Asp He Phe Asn Phe Glu Thr Phe Thr Gly Ser Met 
1505 1510 1515 1520 

Leu Cys Leu Phe Gin He Thr Thr Ser Ala Gly Trp Asp Thr Leu Leu 

1525 1530 1535 

Asn Pro Met Leu Glu Ala Lys Glu His Cys Asn Ser Ser Ser Gin Asp 

1540 1545 1550 

Ser Cys Gin Gin Pro Gin He Ala Val Val Tyr Phe Val Ser Tyr He 

1555 1560 1565 

He He Ser Phe Leu He Val Val Asn Met Tyr He Ala Val He Leu 

1570 1575 1580 

Glu Asn Phe Asn Thr Ala Thr Glu Glu Ser Glu Asp Pro Leu Gly Glu 
1585 1590 i 5 95 UOO 

Asp Asp Phe Glu He Phe Tyr Glu Val Trp Glu Lys Phe Asp Pro Glu 

1605 1610 1615 

Ala Ser Gin Phe He Gin Tyr Ser Ala Leu Ser Asp Phe Ala Asp Ala 

1620 1625 U30 

Leu Pro Glu Pro Leu Arg Val Ala Lys Pro Asn Lys Phe Gin Phe Leu 
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1635 1640 1645 

Val Met Asp Leu Pro Met Val Met Gly Asp Arg Leu His Cys Met Asp 

1650 1655 1660 

Val Leu Phe Ala Phe Thr Thr Arg Val Leu Gly Asp Ser Ser Gly Leu 
1665 1670 1675 1680 

Asp Thr Met Lys Thr Met Met Glu Glu Lys Phe Met Glu Ala Asn Pro 

1685 1690 1695 

Phe Lys Lys Leu Tyr Glu Pro lie Val Thr Thr Thr Lys Arg Lys Glu 

1700 1705 1710 

Glu Glu Gin Gly Ala Ala Val lie Gin Arg Ala Tyr Arg Lys His Met 

1715 1720 1725 

Glu Lys Met Val Lys Leu Arg Leu Lys Asp Arg Ser Ser Ser Ser His 

1730 1735 1740 

Gin Val Phe Cys Asn Gly Asp Leu Ser Ser Leu Asp Val Ala Lys Val 
1745 1750 1755 1760 

Lys Val His Asn Asp 
1765 

(4) INFORMATIONS POUR SEQ ID n° 3; 

(I) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 856 paires de bases 

(B) TYPE: acide nucleique 

(C) TYPE DE BRIN: simple 

(D) TOPOLOGIE: lineaire 
(II) TYPE DE MOLECULE: ADNc 

(III) HYPOTHETIQUE : non 
(IV) ANTISENS: non 
(VI) SOURCE D'ORIGINE: 

(A) ORGANISME: humain 

(B) TYPE DE TISSU: ganglions de la racine dor- 
sale 

(C) TYPE DE CELLULE: nerf peripherique 
(XI) DESCRIPTION DE LA SEQUENCE : SEQ ID n° 3: 

GCTGAGCAGT GGGGCACTGA TATTTGAAGA TGTTCACCTT GAGAACCAAC 
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5 



10 



15 





CCAAAATCCA 


AGAATTACTA 


AATTGTACTG 


ACATTATTTT 


TACACATATT 




TTTATCCTGG 

X X i A 1 AvJVJ 


AGATGGTACT 


AAAATGGGTA 


GCCTTCGGAT 


TTGGAAAGTA 


JL J -L 


TTTCACCAGT 

XXX vAUUnw JL 


GCCTGGTGCT 


GCCTTGATTT 


CATCATTGTG 


ATTGTCTCTG 






CATTAACTTA 


ATGGAATTGA 


AGTCCTTCCG 


GACTCTACGA 


i J J- 


GCACTGAGGC 


CTCTTCGTGC 


GCTGTCCCAG 


TTTGAAGGAA 


TGAAGGTGGT 


301 

•J w X 


GGTCAATGCT 


CTCATAGGTG 


CCATACCTGC 


CATTCTGAAT 


GTTTTGCTTG 


351 


TCTGCCTCAT 


TTTCTGGCTC 


GTATTTTGTA 


TTCTGGGAGT 


ATACTTCTTT 


401 


TCTGGAAAAT 


TTGGGAAATG 


CATTAATGGA 


ACAGACTCAG 


TTATAAATTA 


451 


TACCATCATT 


ACAAATAAAA 


GTCAATGTGA 


AAGTGGCAAT 


TTCTCTTGGA 


501 


TCAACCAGAA 


AGTCAACTTT 


GACAATGTGG 


GAAATGCTTA 


CCTCGCTCTG 


551 


CTGCAAGTGG 


CAACATTTAA 


GGGCTGGATG 


GATATTATAT 


ATGCAGCTGT 


601 


TGATTCCACA 


GAGAAAGAAC 


AACAGCCAGA 


GTTTGAGAGC 


AATTCACTCG 


651 


GTTACATTTA 


CTTCGTAGTC 


TTTATCATCT 


TTGGCTCATT 


CTTCACTCTG 


701 


AATCTCTTCA 


TTGGCGTTAT 


CATTGACAAC 


TTCAACCAAC 


AGCAGAAAAA 


751 


GTTAGGTGGC 


CAAGACATTT 


TTATGACAGA 


AGAACAGAAG 


AAATACTATA 


801 


ATGCAATGAA 


AAAATTAGGA 


TCCAAAAAAC 


CTCAAAAACC 


CATTCCACGG 


851 


CCCGTT 











25 

(5) INFORMATIONS POUR SEQ ID n° 4: 

(I) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 702 paires de bases 

(B) TYPE: acide nucleique 
30 (C) TYPE DE BRIN: simple 

(D) TOPOLOGIE: lineaire 
(II) TYPE DE MOLECULE: RT-PCR 

(A) DESCRIPTION: /desc = "sonde d' ADM/ 

domaine IV" 

35 (III) HYPOTHETIQUE: non 
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(IV) ANTISENS: non 
(VI) SOURCE D'ORIGINE: 

(A) ORGANISMS: rat 

(B) TYPE DE TISSU: ganglions de la racine dor- 
sale 

(C) TYPE DE CELLULE: nerf peripherique 
(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID n" 4: 

1 CTCAACATGG TTACGATGAT GGTGGAGACC GACGAGCAGG' GCGAGGAGAA 
51 GACGAAGGTT CTGGGCAGAA TCAACCAGTT CTTTGTGGCC GTCTTCACGG 
101 GCGAGTGTGT GATGAAGATG TTCGCCCTGC GACAGTACTA TTTCACCAAC 
151 GGCTGGAACG TGTTCGACTT CATAGTGGTG ATCCTGTCCA TTGGGAGTCT 
201 GCTGTTTCT GCAATCCTTA AGTCACTGGA AAACTACTTC TCCCCGACGC 
251 TCTTCCGGGT CATCCGTCTG GCCAGGATCG GCCGCATCCT CAGGCTGATC 
301 CGAGCAGCCA AGGGGATTCG CACGCTGCTC TTCGCCCTCA TGATGTCCCT 
351 GCCCGCCCTC TTCAACATCG GCCTCCTCCT CTTCCTCGTC ATGTTCATCT 
401 ACTCCATGTT CGGCATGGCC AGCTTCGCTA ACGTCGTGGA CGAGGCCGGC 
451 ATCGACGACA TGTTCAACTT CAAGACCTTT GGCAACAGCA TGCTGTGCCT 
501 GTTCCAGATC ACCACCTCGG CCGGCTGGGA CGGCCTCCTC AGCCCCATCC 
551 TCAACACGGG GCCTCCCTAC TGCGACCCCA ACCTGCCCAA CAGCAACGGC 
601 TCCCGGGGGA ACTGCGGGAG CCCGGCGGTG GGCATCATCT TCTTCACCAC 
651 CTACATCATC ATCTCCTTCC TCATCGTGGT CAACATGTAT ATCGCAGTCA 
7 01 TC 

(6) INFORMATIONS POUR SEQ ID n° 5: 

(I) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 5 334 paires de bases 

(B) TYPE: acide nucl€ique 

(C) TYPE DE BRIN: simple 

(D) TOPOLOGIE: lineaire 
(II) TYPE DE MOLECULE: RT-PCR 

(A) DESCRIPTION: ADNc 
(III) HYPOTHETIQUE : non 
(IV) ANTISENS: non 
(VI) SOURCE D'ORIGINE: 
(A) ORGANISME: 
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(B) TYPE DE TISSU: 

(C) TYPE DE CELLULE: 

(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID n° 5: 



5 


1 


GTCGACTCTA 


GATCAGGGTG 


AAGAISGAGG 


AGAGGTACTA 


CCCGGTGATC 




51 


TTCCCGGACG 


AGCGGAATTT 


CCGCCCCTTC 


ACTTCCGACT 


CTCTGGCTGC 




101 


CATAGAGAAG 


CGGATTGCTA 


TCCAAAAGGA 


GAGGAAGAAG 


TCCAAAGACA 




151 


AGGCGGCAGC 


TGAGCCCCAG 


CCTCGGCCTC 


AGCTTGACCT 


AAAGGCCTCC 


10 


201 


AGGAAGTTAC 


CTAAGCTTTA 


TGGTGACATT 


CCCCCTGAGC 


TTGTAGCGAA 




251 


GCCTCTGGAA 


GACCTGGACC 


CATTCTACAA 


AGACCATAAG 


ACATTCATGG 




301 


TGTTGAACAA 


GAAGAGAACA 


ATTTATCGCT 


TCAGCGCCAA 


GCGGGCCTTG 




351 


TTCATTCTGG 


GGCCTTTTAA 


TCCCCTCAGA 


AGCTTAATGA 


TTCGTATCTC 


15 


401 


TGTCCATTCA 


GTCTTTAGCA 


TGTTCATCAT 


CTGCACGGTG 


ATCATCAACT 




451 


GTATGTTCAT 


GGCGAATTCT 


ATGGAGAGAA 


GTTTCGACAA 


CGACATTCCC 




501 


GAATACGTCT 


TCATTGGGAT 


TTATATTTTA 


GAAGCTGTGA 


TTAAAATATT 




551 


GGCAAGAGGC 


TTCATTGTGG 


ATGAGTTTTC 


CTTCCTCCGA 


GATCCGTGGA 


601 


ACTGGCTGGA 


CTTCATTGTC 


ATTGGAACAG 


CGATCGCAAC 


TTGTTTTCCG 




651 


GGCAGCCAAG 


TCAATCTTTC 


AGCTCTTCGT 


ACCTTCCGAG 


TGTTCAGAGC 




701 


TCTGAAGGCG 


ATTTCAGTTA 


TCTCAGGTCT 


GAAGGTCATC 


GTAGGTGCCC 


25 


751 


TGCTGCGCTC 


GGTGAAGAAG 


CTGGTAGACG 


TGATGGTCCT 


CACTCTCTTC 




801 


TGCCTCAGCA 


TCTTTGCCCT 


GGTCGGTCAG 


CAGCTGTTCA 


TGGGAATTCT 




851 


GAACCAGAAG 


TGTATTAAGC 


ACAACTGTGG 


CCCCAACCCT 


GCATCCAACA 




901 


AGGATTGCTT 


TGAAAAGGAA 


AAAGATAGCG 


AAGACTTCAT 


AATGTGTGGT 


30 


951 


ACCTGGCTCG 


GCAGCAGACC 


CTGTCCCAAT 


GGTTCTACGT 


GCGATAAAAC 
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1001 


CACATTGAAC 


CCAGACAATA 


ATTATACAAA 


GTTTGACAAC 


TTTGGCTGGT 


1051 


CCTTTCTCGC 


CATGTTCCGG 


GTTATGACTC 


AAGACTCCTG 


GGAGAGGCTT 


1101 


TACCGACAGA 


TCCTGCGGAC 


CTCTGGGATC 


TACTTTGTCT 


TCTTCTTCGT 


1151 


GGTGGTCATC 


TTCCTGGGCT 


CCTTCTACCT 


GCTTAACCTA 


ACCCTGGCTG 


1201 


TTGTCACCAT 


GGCTTATGAA 


GAACAGAACA 


GAAATGTAGC 


TGCTGAGACA 


1251 


GAGGCCAAGG 


AGAAAATGTT 


TCAGGAAGCC 


CAGCAGCTGT 


TAAGGGAGGA 


1301 


GAAGGAGGCT 


CTGGTTGCCA 


TGGGAATTGA 


CAGAAGTTCC 


CTTAATTCCC 


1351 


TTCAAGCTTC 


ATCCTTTTCC 


CCGAAGAAGA 


GGAAGTTTTT 


CGGTAGTAAG 


1401 


ACAAGAAAGT 


CCTTCTTTAT 


GAGAGGGTCC 


AAGACGGCCC 


AAGCCTCAGC 


1451 


GTCTGATTCA 


GAGGACGATG 


CCTCTAAAAA 


TCCACAGCTC 


CTTGAGCAGA 


1501 


CCAAACGACT 


GTCCCAGAAC 


TTGCCAGTGG 


ATCTCTTTGA 


TGAGCACGTG 


1551 


GACCCCCTCC 


ACAGGCAGAG 


AGCGCTGAGC 


GCTGTCAGTA 


TCTTAACCAT 


1601 


CACCATGCAG 


GAACAAGAAA 


AATTCCAGGA 


GCCTTGTTTC 


CCATGTGGGA 


1651 


AAAATTTGGC 


CTCTAAGTAC 


CTGGTGTGGG 


ACTGTAGCCC 


TCAGTGGCTG 


1701 


TGCAf AAAGA 


AGGTCCTGCG 


GACCATCATG 


ACGGATCCCT 


TTACTGAGCT 


1751 


GGCCATCACC 


ATCTGCATCA 


TCATCAATAC 


CGTTTTCTTA 


GCCGTGGAGC 


1801 


ACCACAACAT 


GGATGACAAC 


TTAAAGACCA 


TACTGAAAAT 


AGGAAACTGG 


1851 


GTTTTCACGG 


GAATTTTCAT 


AGCGGAAATG 


TGTCTCAAGA 


TCATCGCGCT 


1901 


CGACCCTTAC 


CACTACTTCC 


GGCACGGCTG 


GAATGTTTTT 


GACAGCATCG 


1951 


TGGCCCTCCT 


GAGTCTCGCT 


GATGTGCTCT 


ACAACACACT 


GTCTGATAAC 


2001 


AATAGGTCTT 


TCTTGGCTTC 


CCTCAGAGTG 


CTGAGGGTCT 


TCAAGTTAGC 


2051 


CAAATCCTGG 


CCCACGTTAA 


ACACTCTCAT 


TAAGATCATC 


GGCCACTCCG 


2101 


TGGGCGCGCT 


TGGAAACCTG 


ACTGTGGTCC 


TGACTATCGT 


GGTCTTCATC 


2151 


TTTTCTGTGG 


TGGGCATGCG 


GCTCTTCGGC 


ACCAAGTTTA 


ACAAGACCGC 


2201 


CTACGCCACC 


CAGGAGCGGC 


CCAGGCGGCG 


CTGGCACATG 


GATAATTTCT 


2251 


ACCACTCCTT 


CCTGGTGGTG 


TTCCGCATCC 


TCTGTGGGGA 


ATGGATCGAG 


2301 


AACATGTGGG 


GCTGCATGCA 


GGATATGGAC 


GGCTCCCCGT 


TGTGCATCAT 


2351 


TGTCTTTGTC 


CTGATAATGG 


TGATCGGGAA 


GCTTGTGGTG 


CTTAACCTCT 









- 58 - 
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2401 


TCATTGCCTT 


GCTGCTCAAT 


TCCTTCAGCA 


ATGAGGAGAA 


GGATGGGAGC 


2451 


t 

CTGGAAGGAG; AGACCAGGAA 


AACCAAAGTG 


CAGCTAGCCC 


TGGATCGGTT 


2501 


CCGCCGGGCC 


TfCTCCTTCA 


TGCTGCACGC 


TCTTCAGAGT 


TTTTGTTGCA 


2551 


AGAAATGCAG 


GAGGAAAAAC 


TCGCCAAAGC 


CAAAAGAGAC 


AACAGAAAGC 


2601 


TTTGCTGGTG 


AGAATAAAGA 


CTCAATCCTC 


CCGGATGCGA 


GGCCCTGGAA 


2651 


GGAGTATGAT 


ACAGACATGG 


CTTTGTACAC 


TGGACAGGCC 


GGGGCTCCGC 


2701 


TGGCCCCACT 


CGCAGAGGTA 


GAGGACGATG 


TGGAATATTG 


TGGTGAAGGC 


2751 


GGTGCCCTAC 


CCACCTCACA 


ACATAGTGCT 


GGAGTTCAGG 


CCGGTGACCT 


2801 


CCCTCCAGAG 


ACCAAGCAGC 


TCACTAGCCC 


GGATGACCAA 


GGGGTTGAAA 


2851 


TGGAAGTATT 


TTCTGAAGAA 


GATCTGCATT 


TAAGCATACA 


GAGTCCTCGA 


2901 


AAGAAGTCTG 


ACGCAGTGAG 


CATGCTCTCG 


GAATGCAGCA 


CAATTGACCT 


2951 


GAATGATATC 


TTTAGAAATT 


TACAGAAAAC 


AGTTTCCCCC 


AAAAAGCAGC 


3001 


CAGATAGATG 


CTTTCCCAAG 


GGCCTTAGTT 


GTCACTTTCT 


ATGCCACAAA 


3051 


ACAGACAAGA 


GAAAGTCCCC 


CTGGGTCCTG 


TGGTGGAACA 


TTCGGAAAAC 


3101 


CTGCTACCAA 


ATCGTGAAGC 


ACAGCTGGTT 


TGAGAGTTTC 


ATAATCTTTG 


3151 


TTATTCTGCT 


GAGCAGTGGA 


GCGCTGATAT 


TTGAAGATGT 


CAATCTCCCC 


3201 


AGCCGGCCCC 


AAGTTGAGAA 


ATTACTAAGG 


TGTACCGATA 


ATATTTTCAC 


3251 


ATTTATTTTC 


CTCCTGGAAA 


TGATCCTGAA 


GTGGGTGGCC 


TTTGGATTCC 


3301 


GGAGGTATTT 


CACCAGTGCC 


TGGTGCTGGC 


TTGATTTCCT 


CATTGTGGTG 


2251 


GTGTCTGTGC 


TCAGTCTCAT 


GAATCTACCA 


AGCTTGAAGT 


CCTTCCGGAC 


3401 


TCTGCGGGCC 


CTGAGACCTC 


TGCGGGCGCT 


GTCCCAGTTT 


GAAGGAATGA 


3451 


AGGTTGTCGT 


CTACGCCCTG 


ATCAGCGCCA 


TACCTGCCAT 


TCTCAATGTC 


3501 


TTGCTGGTCT 


GCCTCATTTT 


CTGGCTCGTA 


TTTTGTATCT 


TGGGAGTAAA 


3551 


TTTATTTTCT 


GGGAAGTTTG 


GAAGGTGCAT 


TAACGGGACA 


GACATAAATA 


3601 


TGTATTTGGA 


TTTTACCGAA 


GTTCCGAACC 


GAAGCCAATG 


TAACATTAGT 


3651 


AATTACTCGT 


GGAAGGTCCC 


GCAGGTCAAC 


TTTGACAACG 


TGGGGAATGC 


3701 


CTATCTCGCC 


CTGCTGCAAG 


TGGCAACCTA 


TAAGGGCTGG 


CTGGAAATCA 


3751 


TGAATGCTGC 


TGTCGATTCC 


AGAGAGAAAG 


ACGAGCAGCC 


GGACTTTGAG 



3801 


GCGAACCTCT 


ACGCGTATCT 


3851 


CTTCTTTACC 


CTGAACCTCT 


3901 


AGCAGCAGAA 


AAAGTTAGGT 


3951 


AAGAAATATT 


ACAATGCAAT 


4001 


GCCCATCCCA 


AGGCCCCTGA 


4051 


TCACAAGCCA 


GGTCTTTGAC 


4101 


ATGATTATCA 


TGATGGCTGA 


4151 


AACCTTTGAT 


ATCCTCAACA 


4201 


GTCTCATCAA 


AGTCTTTGCT 


4251 


AACTTATTTG 


ATTGTGTGGT 


4301 


TTCCCGCTTG 


GAGGACAGTG 


4351 


TCGTCCGCTT 


GGCTCGGATT 


4401 


CGGGGAATCA 


GGACCCTCCT 


4451 


CTTCAACATC 


GGTCTGCTGC 


4501 


TTGGGATGAG 


CTGGTTTTCC 


4551 


ATCTTCAACT 


TCGAGACCTT 


4601 


AACCACTTCG 


GCTGGCTGGG 


4651 


AAGAACACTG 


CAACTCCTCC 


4701 


GCCGTCGTCT 


ACTTCGTCAG 


4751 


CAACATGTAC 


ATCGCTGTGA 


4801 


AGAGCGAGGA 


CCCTCTGGGA 


4851 


TGGGAGAAGT 


TTGACCCCGA 


4901 


CTCTGACTTT 


GCGGACGCCC 


4951 


ATAAGTTTCA 


GTTTCTAGTG 


5001 


CTCCATTGCA 


TGGATGTTCT 


5051 


CTCCAGCGGC 


TTGGATACCA 


5101 


AGGCCAACCC 


TTTTAAGAAG 


5151 


AGGAAGGAGG 


AGGAGCAAGG 



_ sg m 2771103 

CTACTTTGTG GTTTTTATCA TCTTCGGCTC 
TTATCGGTGT TATTATTGAC AACTTCAATC 
GGCCAAGACA T£TT£ATGAC IGAQGAQCAG 
GAAAAAGTTA GGAACCAAGA AACCTCAAAA 
ACAAATGTCA AGCCTTTGTG TTCGACCTGG 
GTCATCATTC TGGGTCTTAT TGTCTTAAAT 
ATCTGCCGAC CAGCCCAAAG ATGTGAAGAA 
TAGCCTTCGT GGTCATCTTT ACCATAGAGT 
TTGAGGCAAC ACTACTTCAC CAATGGCTGG 
CGTGGTTCTT TCTATCATTA GTACCCTGGT 
ACATTTCTTT CCCGCCCACG CTCTTCAGAG 
GGTCGAATCC TCAGGCTGGT CCGGGCTGCC 
CTTTGCTTTG ATGATGTCTC TCCCCTCTCT 
TCTTCCTGGT GATGTTCATT TACGCCATCT 
AAAGTGAAGA AGGGCTCCGG GATCGACGAC 
TACGGGCAGC ATGCTGTGCC TCTTCCAGAT 
ATACCCTCCT CAACCCCATG CTGGAGGCAA 
TCCCAAGACA GCTGTCAGCA GCCGCAGATA 
TTACATCATC ATCTCCTTCC TCATCGTGGT 
TCCTCGAGAA CTTCAACACA GCCACGGAGG 
GAGGACGACT TTGAAATCTT CTATGAGGTC 
GGCGTCGCAG TTCATCCAGT ATTCGGCCCT 
TGCCGGAGCC GTTGCGTGTG GCCAAGCCGA 
ATGGACTTGC CCATGGTGAT GGGCGACCGC 
CTTTGCTTTC ACTACCAGGG TCCTCGGGGA 
TGAAAACCAT GATGGAGGAG AAGTTTATGG 
CTCTACGAGC CCATAGTCAC CACCACCAAG 
CGCCGCCGTC ATCCAGAGGG CCTACCGGAA 
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5201 ACACATGGAG AAGATGGTCA AACTGAGGCT GAAGGACAGG TCAAGTTCAT 
5251 CGCACCAGGT GTTTTGCAAT GGAGACTTGT CCAGCTTGGA TGTGGCCAAG 
5301 GTCAAGGTTC ACAATGAC1S AACCCTCATC TAG A 
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REVENDICATIONS 
1. Sequence d'ADN isolSe, caracterisee en ce 
qu'elle comprend la sequence nucleotidique indiquee dans 
SEQ ID n° 1 et SEQ ID n° 3. 
5 2. ADN selon la revendication l, caracterise en ce 

que ladite sequence d'ADN code pour une proteine de canal 
sodique ou un fragment de celle-ci, 

3. ADN selon la revendication 2, caracteris§ en ce 
que ladite protSine de canal sodique est la sous-unit§ a 

0 ou un fragment de celle-ci. 

4. ADN selon la revendication 3, caracterise en ce 
que ladite proteine de canal sodique est resistante a la 
tetrodotoxine . 

5. ADN selon la revendication 3 ou 4, caracterise 
en ce que ladite proteine de canal sodique se rencontre 
chez des mammifdres. - . 

6. ADN selon la revendication 3 ou 4, caracterise 
en ce que ladite proteine de canal sodique se rencontre 
chez le rat. 

7. ADN selon la revendication 3 ou 4, caracterise 
en ce que ladite proteine de canal sodique se rencontre 
chez l'homme. 

8. ADN selon la revendication 1, caracterise en ce 
que ledit ADN est de l'ADNc. 

9. ADN selon la revendication 1, caracterise en ce 
que ledit ADN est de 1'ADN synthetique. 

10. Vecteurs d' expression, caracterises en ce 
qu'ils comprennent 1' ADN de la revendication 8. 

11. Vecteurs d' expression, caracterises en ce 
qu'ils comprennent l'ADN synthetique de la revendica- 
tion 9 . 

12. Cellules hotes transformees par les vecteurs 
d' expression de la revendication 10. 

13. Cellules hotes transformees par les vecteurs 
d' expression de la revendication 11. 



2771103 



- 62 - 

14* Polynucleotide recombinant, caracterisg en ce 
qu'il comprend une sequence d'acide nucleique provenant de 
la sequence d'ADN de la revendication l. 

15. Prot§ine de canal sodique codee par un ADN 
selon les revendications 1 a 9 ou des variants allSles de 
celui-ci . 

16. Proteine de canal sodique resistante a la 
tetrodotoxine, codee par un ADN selon les revendications 1 
a 9 ou des variants alleles de celui-ci. 

17. Proteine selon la revendication 16, caracteri- 
see en ce qu'elle comprend la sequence d' aminoacides indi- 
quee dans SEQ ID n° 2, 

18. Procgdd d' identification d' inhibiteurs de la 
proteine de canal sodique resistante a la tetrodotoxine, 
caracterise en ce qu'il comprend ia mise en contact d'un 
compose, soupgonne etre un tel inhibiteur, avec la pro- 
teine de canal sodique de la revendication 16, et la 
mesure de 1'activite de ladite proteine de canal sodique 
exprimee , 

19. Anticorps poly- et/ou monoclonaux, suscites 
contre une proteine de canal sodique resistante a la 
tetrodotoxine, codee par un ADN des revendications 1 £ 9 
ou des variants alleles de celui-ci. 

20. Necessaire de diagnostic, caracterise en ce 
qu'il comprend un polynucleotide selon la revendica- 
tion 14, capable de s'hybrider specif iquement avec une 
proteine de canal sodique resistante a la tetrodotoxine ou 
un fragment d'une telle proteine. 

21. Utilisation d'une sequence d'ADN isolee selon 
les revendications 1 a 9, pour 1' identification d'un com- 
pose soupgonne etre un inhibiteur de proteine de canal 
sodique resistante a la tetrodotoxine. 
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Figure 1 A: SEQ ID NO:l 



1 


GAAGTCACAG 


GAGTGTCTGT 


CAGCGAGAGG 


AAGAAGGGAG 


AGTTTACTGA 


51 


GTGTCTTCTG 


•CCCCTCCTCA 


GGGTG AAGAT 


GGAGGAGAGG 


TACTACCCGG 


101 


TGATCTTCCC 


GGACGAGCGG 


AATTTCCGCC 


CCTTCACTTC 


CGACTCTCTG 


151 


GCTGCCATAG 


AGAAGCGGAT 


TGCTATCCAA 


AAGGAGAGGA 


AGAAGTCCAA 


201 


AGACAAGGCG 


GCAGCTGAGC 


CCCAGCCTCG 


GCCTCAGCTT 


GACCTAAAGG 


251 


CCTCCAGGAA 


GTTACCTAAG 


CTTTATGGTG 


ACATTCCCCC 


TGAGCTTGTA 


301 


GCGAAGCCTC 


TGGAAGACCT 


GGACCCATTC 


TACAAAGACC 


ATAAGACATT 


351 


CATGGTGTTG 


AACAAGAAGA 


GAACAATTTA 


TCGCTTCAGC 


GCCAAGCGGG 


401 


CCTTGTTCAT 


TCTGGGGCCT 


TTTAATCCCC 


TCAGAAGCTT 


AATGATTCGT 


451 


ATCTCTGTCC 


ATTCAGTCTT 


TAGCATGTTC 


ATCATCTGCA 


CGGTGATCAT 


501 


CAACTGTATG 


TTCATGGCGA 


ATTCTATGGA 


GAGAAGTTTC 


GACAACGACA 


551 


TTCCCGAATA 


CGTCTTCATT 


GGGATTTATA 


TTTTAGAAGC 


TGTGATTAAA 


601 


ATATTGGCAA 


GAGGCTTCAT 


TGTGGATGAG 


TTTTCCTTCC 


TCCGAGATCC 


651 


GTGGAACTGG 


CTGGACTTCA 


TTGTCATTGG 


AACAGCGATC 


GCAACTTGTT 


701 


TTCCGGGCAG 


CCAAGTCAAT 


CTTTCAGCTC 


TTCGTACCTT 


CCGAGTGTTC 


751 


AGAGCTCTGA 


AGGCGATTTC 


AGTTATCTCA 


GGTCTGAAGG 


TCATCGTAGG 


801 


TGCCCTGCTG 


CGCTCGGTGA 


AGAAGCTGGT 


AGACGTGATG 


GTCCTCACTC 


851 


TCTTCTGCCT 


CAGCATCTTT 


GCCCTGGTCG 


GTCAGCAGCT 


GTTCATGGGA 


901 


ATTCTGAACC 


AGAAGTGTAT 


TAAGCACAAC 


TGTGGCCCCA 


ACCCTGCATC 


951 


CAACAAGGAT 


TGCTTTGAAA 


AGGAAAAAGA 


TAGCGAAGAC 


TTCATAATGT 


1001 


GTGGTACCTG 


GCTCGGCAGC 


AGACCCTGTC 


CCAATGGTTC 


TACGTGCGAT 


1051 


AAAACCACAT 


TGAACCCAGA 


CAATAATTAT 


ACAAAGTTTG 


ACAACTTTGG 


1101 


CTGGTCCTTT 


CTCGCCATGT 


TCCGGGTTAT 


GACTCAAGAC 


TCCTGGGAGA 


1151 


GGCTTTACCG 


ACAGATCCTG 


CGGACCTCTG 


GGATCTACTT 


TGTCTTCTTC 


1201 


TTCGTGGTGG 


TCATCTTCCT 


GGGCTCCTTC 


TACCTGCTTA 


ACCTAACCCT 
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Figure 1B:SEQID NO:l 



1251 


GGCTGTTGTC 


ACCATGGCTT 


ATGAAGAACA 


GAACAGAAAT 


GTAGCTGCTG 


1301 


AGACAGAGGC 


CAAGGAGAAA 


ATGTTTCAGG 


AAGCCCAGCA 


GCTGTTAAGG 


1351 


GAGGAGAAGG 


AGGCTCTGGT 


TGCCATGGGA 


ATTGACAGAA 


GTTCCCTTAA 


1401 


TTCCCTTCAA 


GCTTCATCCT 


TTTCCCCGAA 


GAAGAGGAAG 


TTTTTCGGTA 


1451 


GTAAGACAAG 


AAAGTCCTTC 


TTTATGAGAG 


GGTCCAAGAC 


GGCCCAAGCC 


1501 


TCAGCGTCTG 


ATTCAGAGGA 


CGATGCCTCT 


AAAAATCCAC 


AGCTCCTTGA 


1551 


GCAGACCAAA 


CGACTGTCCC 


AGAACTTGCC 


AGTGGATCTC 


TTTGATGAGC 


1601 


ACGTGGACCC 


CCTCCACAGG 


CAGAGAGCGC 


TGAGCGCTGT 


CAGTATCTTA 


1651 


ACCATCACCA 


TGCAGGAACA 


AGAAAAATTC 


CAGGAGCCTT 


GTTTCCCATG 


1701 


TGGGAAAAAT 


TTGGCCTCTA 


AGTACCTGGT 


GTGGGACTGT 


AGCCCTCAGT 


1751 


GGCTGTGCAT 


AAAGAAGGTC 


CTGCGGACCA 


TCATGACGGA 


TCCCTTTACT 


1801 


GAGCTGGCCA 


TCACCATCTG 


CATCATCATC 


AATACCGTTT 


TCTTAGCCGT 


1851 


GGAGCACCAC 


AACATGGATG 


ACAACTTAAA 


GACCATACTG 


AAAATAGGAA 


1901 


ACTGGGTTTT 


CACGGGAATT 


TTCATAGCGG 


AAATGTGTCT 


CAAGATCATC 


1951 


GCGCTCGACC 


CTTACCACTA 


CTTCCGGCAC 


GGCTGGAATG 


TTTTTGACAG 


2001 


CATCGTGGCC 


CTCCTGAGTC 


TCGCTGATGT 


GCTCTACAAC 


ACACTGTCTG 


2051 


ATAACAATAG 


GTCTTTCTTG 


GCTTCCCTCA 


GAGTGCTGAG 


GGTCTTCAAG 


2101 


TTAGCCAAAT 


CCTGGCCCAC 


GTTAAACACT 


CTCATTAAGA 


TCATCGGCCA 


2151 


CTCCGTGGGC 


GCGCTTGGAA 


ACCTGACTGT 


GGTCCTGACT 


ATCGTGGTCT 


2201 


TCATCTTTTC 


TGTGGTGGGC 


ATGCGGCTCT 


TCGGCACCAA 


GTTTAACAAG 


2251 


ACCGCCTACG 


CCACCCAGGA 


GCGGCCCAGG 


CGGCGCTGGC 


ACATGGATAA 


2301 


TTTCTACCAC 


TCCTTCCTGG 


TGGTGTTCCG 


CATCCTCTGT 


GGGGAATGGA 


2351 


TCGAGAACAT 


GTGGGGCTGC 


ATGCAGGATA 


TGGACGGCTC 


CCCGTTGTGC 


2401 


ATCATTGTCT 


TTGTCCTGAT 


AATGGTGATC 


GGGAAGCTTG 


TGGTGCTTAA 



2771103 



3/27 

Figure 1C: SEQIDNO:! 



2451 


CCTCTTCATT " 


GCCTTGCTGC 


TCAATTCCTT 


CAGCAATGAG 


GAGAAGGATG 


2501 


GGAGCCTGGA 


AGGAGAGACC 


AGGAAAACCA 


AAGTGCAGCT 


AGCCCTGGAT 


2551 


CGGTTCCGCC 


GGGCCTTCTC 


CTTCATGCTG 


CACGCTCTTC 


AGAGTTTTTG 


2601 


TTGCAAGAAA TGCAGGAGGA AAAACTCGCC 


AAAGCCAAAA 


GAGACAACAG 


2651 


AAAGCTTTGC TGGTGAGAAT AAAGACTCAA 


TCCTCCCGGA 


TGCGAGGCCC 


2701 


TGGAAGGAGT 


ATGATACAGA 


CATGGCTTTG 


TACACTGGAC 


AGGCCGGGGC 


2751 


TCCGCTGGCC 


CCACTCGCAG 


AGGTAGAGGA 


CGATGTGGAA 


TATTGTGGTG 


2801 


AAGGCGGTGC 


CCTACCCACC 


TCACAACATA 


GTGCTGGAGT 


TCAGGCCGGT 


2851 


GACCTCCCTC 


CAGAGACCAA 


GCAGCTCACT 


AGCCCGGATG 


ACCAAGGGGT 


2901 


TGAAATGGAA 


GTATTTTCTG 


AAGAAGATCT 


GCATTTAAGC 


ATACAGAGTC 


2951 


CTCGAAAGAA 


GTCTGACGCA 


GTGAGCATGC 


TCTCGGAATG 


CAGCACAATT 


3001 


GACCTGAATG 


ATATCTTTAG 


AAATTTACAG 


AAAACAGTTT 


CCCCCAAAAA 


3051 


GCAGCCAGAT 


AGATGCTTTC 


CCAAGGGCCT 


TAGTTGTCAC 


TTTCTATGCC 


3101 


ACAAAACAGA 


CAAGAGAAAG 


TCCCCCTGGG 


TCCTGTGGTG 


GAACATTCGG 


3151 


AAAACCTGCT 


ACCAAATCGT 


GAAGCACAGC 


TGGTTTGAGA 


GTTTCATAAT 


3201 


CTTTGTTATT 


CTGCTGAGCA 


GTGGAGCGCT 


GATATTTGAA 


GATGTCAATC 


3251 


TCCCCAGCCG 


GCCCCAAGTT 


GAGAAATTAC 


TAAGGTGTAC 


CGATAATATT 


3301 


TTCACATTTA 


TTTTCCTCCT 


GGAAATGATC 


CTGAAGTGGG 


TGGCCTTTGG 


3351 


ATTCCGGAGG 


TATTTCACCA 


GTGCCTGGTG 


CTGGCTTGAT 


TTCCTCATTG 


3401 


TGGTGGTGTC 


TGTGCTCAGT 


CTCATGAATC 


TACCAAGCTT 


GAAGTCCTTC 


3451 


CGGACTCTGC 


GGGCCCTGAG 


ACCTCTGCGG 


GCGCTGTCCC 


AGTTTGAAGG 


3501 


AATGAAGGTT 


GTCGTCTACG 


CCCTGATCAG 


CGCCATACCT 


GCCATTCTCA 


3551 


ATGTCTTGCT 


GGTCTGCCTC 


ATTTTCTGGC 


TCGTATTTTG 


TATCTTGGGA 


3601 


GTAAATTTAT 


TTTCTGGGAA 


GTTTGGAAGG 


TGCATTAACG 


GGACAGACAT 
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Figure 


ID: SEQ ID NO:l 




3651 


AAATATGTAT 


TTGGATTTTA 


CCGAAGTTCC 


GAACCGAAGC 


CAATGTAACA 


3701 


TTAGTAATTA 


CTCGTGGAAG 


GTCCCGCAGG 


TCAACTTTGA 


CAACGTGGGG 


3751 


AATGCCTATC 


TCGCCCTGCT 


GCAAGTGGCA 


ACCTATAAGG 


GCTGGCTGGA 


3801 


AATCATGAAT 


GCTGCTGTCG 


ATTCCAGAGA 


GAAAGACGAG 


CAGCCGGACT 


3851 


TTGAGGCGAA 


CCTCTACGCG 


TATCTCTACT 


TTGTGGTTTT . 


TATCATCTTC 


3901 


GGCTCCTTCT 


TTACCCTGAA 


CCTCTTTATC 


GGTGTTATTA 


TTGACAACTT 


3951 


CAATCAGCAG 


CAGAAAAAGT 


TAGGTGGCCA 


AGACATTTTT 


ATGACAGAAG 


4001 


AACAGAAGAA 


ATATTACAAT 


GCAATGAAAA 


AGTTAGGAAC 


CAAGAAACCT 


4051 


CAAAAGCCCA 


TCCCAAGGCC 


CCTGAACAAA 


TGTCAAGCCT 


TTGTGTTCGA 


4101 


CCTGGTCACA 


AGCCAGGTCT 


TTGACGTCAT 


CATTCTGGGT 


CTTATTGTCT 


4151 


TAAATATGAT 


TATCATGATG 


GCTGAATCTG 


CCGACCAGCC 


CAAAGATGTG 


4201 


AAGAAAACCT 


TTGATATCCT 


CAACATAGCC 


TTCGTGGTCA 


TCTTTACCAT 


4251 


AGAGTGTCTC 


ATCAAAGTCT 


TTGCTTTGAG 


GCAACACTAC 


TTCACCAATG 


4301 


GCTGGAACTT 


ATTTGATTGT 


GTGGTCGTGG 


TTCTTTCTAT 


CATTAGTACC 


4351 


CTGGTTTCCC 


GCTTGGAGGA 


CAGTGACATT 


TCTTTCCCGC 


CCACGCTCTT 


4401 


CAGAGTCGTC 


CGCTTGGCTC 


GGATTGGTCG 


AATCCTCAGG 


CTGGTCCGGG 


4451 


CTGCCCGGGG 


AATCAGGACC 


CTCCTCTTTG 


CTTTGATGAT 


GTCTCTCCCC 


4501 


TCTCTCTTCA 


ACATCGGTCT 


GCTGCTCTTC 


CTGGTGATGT 


TCATTTACGC 


4551 


CATCTTTGGG 


ATGAGCTGGT 


TTTCCAAAGT 


GAAGAAGGGC 


TCCGGGATCG 


4601 


ACGACATCTT 


CAACTTCGAG 


ACCTTTACGG 


GCAGCATGCT 


GTGCCTCTTC 


4651 


CAGATAACCA 


CTTCGGCTGG 


CTGGGATACC 


CTCCTCAACC 


CCATGCTGGA 


4701 


GGCAAAAGAA 


CACTGCAACT 


CCTCCTCCCA 


AGACAGCTGT 


CAGCAGCCGC 


4751 


AGATAGCCGT 


CGTCTACTTC 


GTCAGTTACA 


TCATCATCTC 


CTTCCTCATC 


4801 


GTGGTCAACA 


TGTACATCGC 


TGTGATCCTC 


GAGAACTTCA 


ACACAGCCAC 
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Figure IE: SEQ ID NO: 1 



4851 


GGAGGAGAGC 


GAGGACCCTC 


TGGGAGAGGA 


CGACTTTGAA 


ATCTTCTATG 


4901 


AGGTCTGGGA * 


GAAGTTTGAC 


CCCGAGGCGT 


CGCAGTTCAT 


CCAGTATTCG 


4951 


GCCCTCTCTG 


ACTTTGCGGA 


CGCCCTGCCG 


GAGCCGTTGC 


GTGTGGCCAA 


5001 


GCCGAATAAG 


TTTCAGTTTC 


TAGTGATGGA 


CTTGCCCATG 


GTGATGGGCG 


5051 


ACCGCCTCCA 


TTGCATGGAT 


GTTCTCTTTG 


CTTTCACTAC 


CAGGGTCCTC 


5101 


GGGGACTCCA 


GCGGCTTGGA 


TACCATGAAA 


ACCATGATGG 


AGGAGAAGTT 


5151 


TATGGAGGCC 


AACCCTTTTA 


AGAAGCTCTA 


CGAGCCCATA 


GTCACCACCA 


5201 


CCAAGAGGAA 


GGAGGAGGAG 


CAAGGCGCCG 


CCGTCATCCA 


GAGGGCCTAC 


5251 


CGGAAACACA 


TGGAGAAGAT 


GGTCAAACTG 


AGGCTGAAGG 


ACAGGTCAAG 


5301 


TTCATCGCAC 


CAGGTGTTTT 


GCAATGGAGA 


CTTGTCCAGC 


TTGGATGTGG 


5351 


CCAAGGTCAA 


GGTTCACAAT 


GACTGAACCC 


TCATCTCCAC 


CCCTACCTCA 


5401 


CTGCCTCACA 


GCTTAGCCTC 


CAGCCTCTGG 


CGAGCAGGCG 


GCAGACTCAC 


5451 


TGAACACAGG 


CCGTTCGATC 


TGTGTTTTTG 


GCTGAACGAG 


GTGACAGGTT 


5501 


GGCGTCCATT 


TTTAAATGAC 


TCTTGGAAAG 


ATTTCATGTA 


GAGAGATGTT 


5551 


AGAAGGGACT 


GCAAAGGACA 


CCGACCATAA 


CGGAAGGCCT 


GGAGGACAGT 


5601 


CCAACTTACA 


TAAAGATGAG 


AAACAAGAAG 


GAAAGATCCC 


AGGAAAACTT 


5651 


CAGATTGTGT 


TCTCAGTACA 


TCCCCCAATG 


TGTCTGTTCG 


GTGTTTTGAG 


5701 


TATGTGACCT 


GCCACATGTA 


GCTCTTTTTT 


GCATGTACGT 


CAAAACCCTG 


5751 


CAGTAAGTTG 


ATAGCTTGCT 


ACGGGTGTTC 


CTACCAGCAT 


CACAGAATTG 


5801 


GGTGTATGAC 


TCAAACCTAA 


AAGCATGACT 


CTGACTTGTC 


AGTCAGCACC 


5851 


CCGACTTTCA 


GACGCTCCAA 


TCTCTGTCCC 


AGGTGTCTAA 


CGAATAAATA 


5901 


GGTAAAAG 











2771103 



6/27 

Figure 2A: SEQ ED NO: 2 
Met Glu Glu Arg Tyr Tyr Pro Val He Phe Pro Asp Glu Arg Asn Phe 
1 5 ' 10 15 

Arg Pro Phe Thr Ser Asp Ser Leu Ala Ala He Glu Lys Arg He Ala 

20 25 30 

He Gin Lys Glu Arg Lys Lys Ser Lys Asp Lys Ala Ala Ala Glu Pro 

35 40 45 

Gin Pro Arg Pro Gin Leu Asp Leu Lys Ala Ser Arg Lys Leu Pro Lys 

50 55 60 

Leu Tyr .Gly Asp He Pro Pro Glu Leu Val Ala Lys Pro Leu Glu Asp 
65 70 75 80 

Leu Asp Pro Phe Tyr Lys Asp His Lys Thr Phe Met Val Leu Asn Lys 

85 90 95 

Lys Arg Thr lie Tyr Arg Phe Ser Ala Lys Arg Ala Leu Phe He Leu 

100 105 HO 

Gly Pro Phe Asn Pro Leu Arg Ser Leu Met He Arg He Ser Val His 

115 120 125 

Ser Val Phe Ser Met Phe He He Cys Thr Val He lie Asn Cys Met 

130 135 140 

Phe Met Ala Asn Ser Met Glu Arg Ser Phe Asp Asn Asp lie Pro Glu 
145 150 155 160 

Tyr Val Phe He Gly He Tyr He Leu Glu Ala Val He Lys lie Leu 

165 170 175 

Ala Arg Gly Phe lie Val Asp Glu Phe Ser Phe Leu Arg Asp Pro Trp 

180 185 190 

Asn Trp Leu Asp Phe lie Val He Gly Thr Ala He Ala Thr. Cys Phe 

195 200 205 

Pro Gly Ser Gin Val Asn Leu Ser Ala Leu Arg Thr Phe Arg Val Phe 

210 215 220 

Arg Ala Leu Lys Ala lie Ser Val He Ser Gly Leu Lys Val lie Val 
225 230 235 240 

Gly Ala Leu Leu Arg Ser Val Lys Lys Leu Val Asp Val Met Val Leu 

245 250 255 

Thr Leu Phe Cys Leu Ser lie Phe Ala Leu Val Gly Gin Gin Leu Phe 

260 265 270 

Met Gly lie Leu Asn Gin Lys Cys He Lys His Asn Cys Gly Pro Asn 
275 280 285 
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Pro Ala .Ser Asn Lys Asp Cys Phe Glu Lys Glu Lys Asp Ser Glu Asp 

290 295 300 

Phe He Met Cys Gly Thr Trp Leu Gly Ser Arg Pro Cys Pro Asn Gly 
305 310 ' 315 320 
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2B: SEQ 



ID NO: 2 



Ser Thr Cys Asp Lys Thr Thr Leu Asn Pro Asp Asn Asn Tyr Thr Lys 

325 330 335 

Phe Asp Asn Phe Gly Trp Ser Phe Leu Ala Met Phe Arg Val Met Thr 

340 345 350 

Gin Asp Ser Trp Glu Arg Leu Tyr Arg Gin lie Leu Arg Thr Ser Gly 

355 360 365 

lie Tyr Phe Val Phe Phe Phe Val Val Val lie Phe Leu Gly Ser Phe 

370 375 380 

Tyr Leu Leu Asn Leu Thr Leu Ala Val Val Thr Met Ala Tyr Glu Glu 
385 390 395 400 

Gin Asn Arg Asn Val Ala Ala Glu Thr Glu Ala Lys Glu Lys Met Phe 

405 410 415 

Gin Glu Ala Gin Gin Leu Leu Arg Glu Glu Lys Glu Ala Leu Val Ala 

420 425 430 

Met Gly lie Asp Arg Ser Ser Leu Asn Ser Leu Gin Ala Ser Ser Phe 

435 440 445 

Ser Pro Lys Lys Arg Lys Phe Phe Gly Ser Lys Thr Arg Lys Ser Phe 

450 455 460 

Phe Met Arg Gly Ser Lys Thr Ala Gin Ala Ser Ala Ser Asp Ser Glu 
465 470 475 480 

Asp Asp Ala Ser Lys Asn Pro Gin Leu Leu Glu Gin Thr Lys Arg Leu 



Ser Gin Asn Leu Pro Val Asp Leu Phe Asp Glu His Val Asp Pro Leu 

500 505 510 

His Arg Gin Arg Ala Leu Ser Ala Val Ser lie Leu Thr He Thr Met 

515 520 525 

Gin Glu Gin Glu Lys Phe Gin Glu Pro Cys Phe Pro Cys Gly Lys Asn 

530 535 540 

Leu Ala Ser Lys Tyr Leu Val Trp Asp Cys Ser Pro Gin Trp Leu Cys 

545 550 555 560 

He Lys Lys Val Leu Arg Thr He Met Thr Asp Pro Phe Thr Glu Leu 

565 570 575 

Ala He Thr He Cys He He He Asn Thr Val Phe Leu Ala Val Glu 

580 585 590 

His His Asn Met Asp Asp Asn Leu Lys Thr lie Leu Lys lie Gly Asn 



485 



490 



495 
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595 600 605 

Trp Val Phe Thr Gly lie Phe He Ala Glu Met Cys Leu Lys He He 
610 615 620 
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Figure 2C: SEQ ID NO: 2 



Ala Leu Asp Pro Tyr His Tyr Phe Arg His Gly Trp Asn Val Phe Asp 
$25 630 635 640 

Ser He Val Ala Leu Leu Ser Leu Ala Asp Val Leu Tyr Asn Thr Leu 

645 650 655 

Ser Asp Asn Asn Arg Ser Phe Leu Ala Ser Leu Arg Val Leu Arg Val 

660 665 670 

Phe Lys Leu Ala Lys Ser Trp Pro Thr Leu Asn Thr Leu He Lys He 

675 680 685 

He Gly His Ser Val Gly Ala Leu Gly Asn Leu Thr Val Val Leu Thr 

690 695 700 

He Val Val Phe He Phe Ser Val Val Gly Met Arg Leu Phe Gly Thr 
705 710 715 720 

Lys Phe Asn Lys Thr Ala Tyr Ala Thr Gin Glu Arg Pro Arg Arg Arg 

725 730 735 

Trp His Met Asp Asn Phe Tyr His Ser Phe Leu Val Val Phe Arg He 

•740 745 750 

Leu Cys Gly Glu Trp He Glu Asn Met Trp Gly Cys Met Gin Asp Met 

755 760 765 

Asp Gly Ser Pro Leu Cys lie He Val Phe Val Leu He Met Val He 

770 775 780 

Gly Lys Leu Val Val Leu Asn Leu Phe He Ala Leu Leu Leu Asn Ser 
785 790 795 800 

Phe Ser Asn Glu Glu Lys Asp Gly Ser Leu Glu Gly Glu Thr Arg Lys 

805 810 815 

Thr Lys Val Gin Leu Ala Leu Asp Arg Phe Arg Arg Ala Phe Ser Phe 

820 825 830 

Met Leu His Ala Leu Gin Ser Phe Cys Cys Lys Lys Cys Arg Arg Lys 

835 840 845 

Asn Ser Pro Lys Pro Lys Glu Thr Thr Glu Ser^Phe Ala Gly Glu Asn 

850 855 860 

Lys Asp Ser lie Leu Pro Asp Ala Arg Pro Trp Lys Glu Tyr Asp Thr 
865 870 875 880 

Asp Met Ala Leu Tyr Thr Gly Gin Ala Gly Ala Pro Leu Ala Pro Leu 
885 890 895 
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Ala Glu Val Glu Asp Asp Val Glu Tyr Cys Gly Glu Gly Gly Ala Leu 
900 905 910 
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Figure 2D: SEQ ID NO: 2 

Pro Thr Ser Gin His" Ser Ala Gly Val Gin Ala Gly Asp Leu Pro Pro 

915 920 925 

Glu Thr Lys Gin Leu Thr Ser Pro Asp Asp Gin Gly Val Glu Met Glu 

930 935 940 

Val Phe Ser Glu Glu Asp Leu His Leu Ser He Gin Ser Pro Arg Lys 
945 950 955 960 

Lys Ser Asp Ala Val Ser Met Leu Ser Glu Cys Ser Thr He Asp Leu 

965 970 975 

Asn Asp He Phe Arg Asn Leu Gin Lys Thr Val Ser Pro Lys Lys Gin 

980 985 990 

Pro Asp Arg Cys Phe Pro Lys Gly Leu Ser Cys His Phe Leu Cys His 

995 1000 1005 

Lys Thr Asp Lys Arg Lys Ser Pro Trp Val Leu Trp Trp Asn He Arg 

1010 1015 1020 

Lys Thr Cys Tyr Gin He Val Lys His Ser Trp Phe Glu Ser Phe He 
1025 1030 1035 1040 

He Phe Val He Leu Leu Ser Ser Gly Ala Leu He Phe Glu Asp Val 

1045 1050 1055 

Asn Leu Pro Ser Arg Pro Gin Val Glu Lys Leu Leu Arg Cys Thr Asp 

1060 1065 1070 

Asn He Phe Thr Phe He Phe Leu Leu Glu Met He Leu Lys Trp Val 

1075 1080 1085 

Ala Phe Gly Phe* Arg Arg Tyr Phe Thr Ser Ala Trp Cys Trp Leu Asp 

1090 1095 1100 

Phe Leu He Val Val Val Ser Val Leu Ser Leu Met Asn Leu Pro Ser 
1105 1110 1115 1120 

Leu Lys Ser Phe Arg Thr Leu Arg Ala Leu Arg Pro Leu Arg Ala Leu 

1125 1130 1135 

Ser Gin Phe Glu Gly Met Lys Val Val Val Tyr Ala Leu He Ser Ala 

1140 1145 1150" 

He Pro Ala He Leu Asn Val Leu Leu Val Cys Leu He Phe Trp Leu 

1155 1160 1165 

Val Phe Cys He Leu Gly Val Asn Leu Phe Ser Gly Lys Phe Gly Arg 

1170 1175 1180 

Cys He Asn Gly Thr Asp He Asn Met Tyr Leu Asp Phe Thr Glu Val 
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1185 1190 1195 1200 

Pro Asn Arg Ser Gin Cys Asn lie Ser Asn Tyr Ser Trp Lys Val Pro 
1205 1210 1215 
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Figure 2E: SEQ ED NO: 2 
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Gin Val Asn Phe Asp Asn Val Gly Asn Ala Tyr Leu Ala Leu Leu Gin 

1220 1225 1230 

Val Ala Thr Tyr Lys Gly Trp Leu Glu lie Met Asn Ala Ala Val Asp 

1235 1240 1245 

Ser Arg Glu Lys Asp Glu Gin Pro Asp Phe Glu Ala Asn Leu Tyr Ala 

1250 1255 1260 

Tyr Leu Tyr Phe Val Val Phe lie lie Phe Gly Ser Phe Phe Thr Leu 
1265 1270 1275 1280 

Asn Leu Phe lie Gly Val lie He Asp Asn Phe Asn Gin Gin Gin Lys 

1285 1290 1295 

Lys Leu Gly Gly Gin Asp He Phe Met Thr Glu Glu Gin Lys Lys Tyr 

1300 1305 1310 

Tyr Asn Ala Met Lys Lys Leu Gly Thr Lys Lys Pro Gin Lys Pro He 

1315 1320 1325 

Pro Arg Pro Leu Asn Lys Cys Gin Ala Phe Val Phe Asp Leu Val Thr 

1330 1335 1340 

Ser Gin Val Phe Asp Val He He Leu Gly Leu He Val Leu Asn Met 
1345 1350 1355 1360 

lie lie Met Met Ala Glu Ser Ala Asp Gin Pro Lys Asp Val Lys Lys 

1365 1370 1375 

Thr Phe Asp He Leu Asn He Ala Phe Val Val He Phe Thr He Glu 

1380 1385 1390 

Cys Leu He Lys Val Phe Ala Leu Arg Gin His Tyr Phe Thr Asn Gly 

1395 1400 1405 

Trp Asn Leu Phe Asp Cys Val Val Val Val Leu Ser He lie Ser Thr 

1410 1415 1420 

Leu Val Ser Arg Leu Glu Asp Ser Asp He Ser Phe Pro Pro Thr Leu 
1425 1430 1435 1440 

Phe Arg Val Val Arg Leu Ala Arg lie Gly Arg lie Leu Arg Leu Val 

1445 1450 1455 

Arg Ala Ala Arg Gly lie Arg Thr Leu Leu Phe Ala Leu Met Met Ser 

1460 1465 1470 

Leu Pro Ser Leu Phe Asn lie Gly Leu Leu Leu Phe Leu Val Met Phe 

1475 1480 1485 

lie Tyr Ala lie Phe Gly Met Ser Trp Phe Ser Lys Val Lys Lys Gly 
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1490 1495 1500 

Ser Gly He Asp Asp He Phe Asn Phe Glu Thr Phe Thr Gly Ser Met 
1505 • 1510 1515 1520 



( 
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Figure 2F: SEQ ID NO: 2 



Leu Cys Leu Phe Gin lie Thr Thr Ser Ala Gly Trp Asp Thr Leu Leu 

1525 1530 1535 

Asn Pro Met Leu Glu Ala Lys Glu His Cys Asn Ser Ser Ser Gin Asp 

1540 1545 1550 

Ser Cys Gin Gin Pro Gin lie Ala Val Val Tyr Phe Val Ser Tyr lie 

1555 1560 1565 

He He Ser Phe Leu He Val Val Asn Met Tyr He Ala Val He Leu 

1570 1575 1580 

Glu Asn Phe Asn Thr Ala Thr Glu Glu Ser Glu Asp Pro Leu Gly Glu 
1585 1590 1595 1600 

Asp Asp Phe Glu He Phe Tyr Glu Val Trp Glu Lys Phe Asp Pro Glu 

1605 1610 1615 

Ala Ser Gin Phe He Gin Tyr Ser Ala Leu Ser Asp Phe Ala Asp Ala 

1620 1625 1630 

Leu Pro Glu Pro Leu Arg Val Ala Lys Pro Asn Lys Phe Gin Phe Leu 

1635 1640 1645 

Val Met Asp Leu Pro Met Val Met Gly Asp Arg Leu His Cys Met Asp 

1650 1655 1660 

Val Leu Phe Ala Phe Thr Thr Arg Val Leu Gly Asp Ser Ser Gly Leu 
1665 1670 1675 1680 

Asp Thr Met Lys Thr Met Met Glu Glu Lys Phe Met Glu Ala Asn Pro 

1685 1690 1695 

Phe Lys Lys Leu Tyr Glu Pro He Val Thr Thr Thr Lys Arg Lys Glu 

1700 1705 ' 1710 

Glu Glu Gin Gly Ala Ala Val He Gin Arg Ala Tyr Arg Lys His Met 

1715 1720 1725 

Glu Lys Met Val Lys Leu Arg Leu Lys Asp Arg Ser Ser Ser Ser His 

1730 1735 1740 

Gin Val Phe Cys Asn Gly Asp Leu Ser Ser Leu Asp Val Ala Lys Val 
174 5 17 50- 17 55 17 6 0 

Lys Val His Asn Asp 
1765. 



2771103 



17/27 
Figure 2G; SEQ ID NO:2 

1 MEERYYPVIF PDERNFRPFT SDSLAAIEKR IAIQKERKKS KDKAAAEPQP 

O 

51 RPQLDLKASR KLPKLYGDIP PELVAKPLED LDPFYKDHKT FMVLNKKRTI 

0 

101 YRFSAKRALF ILGPFNPLRS LMIRISVHSV FSMFIICTVI INCMFMANSM 

| ISl I 

151 ERSFDNDIPE YVFIGIYILE AVIKILARGF IVDEFSFLRD PWNWLDFIVI 

| IS2 | I IS3 

201 GTAIATCFPG SQVNLSALRT FRVFRALKAI SVISGLKVIV GALLRSVKKL 

1 . | ISA I 

251 VDVMVLTLFC LSIFALVGQQ LFMGILNQKC IKHNCGPNPA SNKDCFEKEK 
| IS5 1 

3 01 DSEDFIMCGT WLGSRPCPNG STCDKTTLNP DNNYTKFDNF GWSFLAMFRV 

351 MTODSWERLY RQILRTSGIY FVFFFVWIF LGSFYLLNLT LAWTMAYEE 
♦ I IS6 I 

4 01 QNRNVAAETE AXEKMFQEAQ QLLREEKEAL VAMGIDRSSL NSLQASSFSP 

4 51 KKRKFFGSKT RKSFFMRGSK TAQASASDSE DDASKMPQLL EQTKRLSQNL 

O 

501 PVDLFDEHVD PLHRQRALSA VSILTITMQE QEKFQEPCFP CGKNLASKYL 

551 VWDCSPQWLC IKKVLRTIMT DPFTELAITI CIIINTVFLA VEHHNMDDNL 

| IIS1 1 

601 KTILKIGNWV FTGIFIAEMC LKIIALDPYH YFRHGWNVFD SIVALLSLAD 

| IIS2 I I IIS3- 

651 VLYNTLSDMN RSFLASLRVL RVFK1AKSWP TLNTLIKIIG H SVG ALGNLT 

1 • | HS4-- 1 

701 WLTIWFIF SWGMRLFGT KFNKTAYATQ ERPRRRWHMD NFYHSFLWF 

IIS5--- -I 

751 RILCGEWIEN MWGCMQDMDG SPLCIIVFVL IMVIGKLWL NLFIALLLNS 

|- IIS6 I 

801 FSNEEKDGSL EGETRKTKVQ LALDRFRRAF SFMLHALQSF CCKKCRRKNS 

0 

851 PKPKETTESF AGENKDSILP DARPWKEYDT DMALYTGQAG APLAPLAEVE 

901 DDVEYCGEGG ALPTSQHSAG VQAGDLPPET KQLTSPDDQG VEMEVFSEED 

951 LHLSIQSPRK KSDAVSMLSE CSTIDLNDIF RNLQKTVSPK KQPDRCFPKG 
0 

1001 LSCHFLCHKT DKRKSPWVLW WNIRXTCYQI VKHSWFESFI IFVILLSSGA 

| IIIS1 

1051 LIFZDVNLPS RPQVEKLLRC TDNIFTFIFL LEMILKWVAF GFRRYFTSAW 

--| | IIIS2 I I- 

1101 CWLDFLIVW SVLSLMNLPS LKSFRTLRAL RPLRALSQFE GMKVWYALI 

IIIS3 1 | IIIS4 1 

1151 SA1PAILNVL LVCLIFWLVF CILGVNLrSG KFGRCINGTD INMYLDFTEV 

I-- IIIS5--- | 

1201 PNRSQCNISN YSWKVPQVNF DNVGNAYLAL LQVATYKGWL EIMNAAVDSR 
• • ♦ 

1251 EKDEQPDFEA NLYAYLYFW FIIFGSFF7L NLFIGVIIDN FNQQQKKLGG 
|--- ---IIIS6 -| 
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Figure 2H: SEQ ID NO: 2 



1301 QDIFMTEEQK KYYNAMKKLG TKKPQKPIPR PLNKCQAFVF DLVTSQVFDV 

I™ 

1351 IILGLIVLNM IIMMAESADQ PKDVKKTFDI LNIAFWIFT IECLIKVFAL 

IVS1 1 I IVS2 - I 

1401 RQHYFTNGWN LFDCWWLS IISTLVSRLE DSDISFPPTL FRWRLARIG 

| IVS3 -I I 

14 51 RILRLVRAAR GIRTLLFALM MSLPSLFNIG LLLFLVMFIY AIFGMSWFSK 

IVS4 1 I IVS5 

1501 VKXGSGIDDI FNFETFTGSM LCLFQITTSA GWDTLLNPML EAKEHCNSSS 
I 0 

1551 QDSCQQPOIA WYFVSYIII SFLIWNMYI AVILENFNTA TEESEDPLGE 

| IVS6 1 

1601 DDFEIFYEVW EKFDPEASQF IQYSALSDFA DALPEPLRVA KPNKFQFLVM 

1651 DLPMVMGDRL HCMDVLFAFT TRVLGDSSGL DTMKTMMEEK FMEANPFKKL 

1701 YEPIVTTTKR KEEEQGAAVI QRAYRKHMEK MVKLSLKDRS SSSHQVFCNG 

1751 DLSSLDVAKV KVHND* 
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Figure 3A: SEQ ID NO:3 




1 


GCTGAGCAGT 


GGGGCACTGA 


TATTTGAAGA 


TGTTCACCTT 


GAGAACCAAC 


51 


CCAAAATCCA - 


AGAATTACTA 


AATTGTACTG 


ACATTATTTT 


TACACATATT 


101 


TTTATCCTGG 


AGATGGTACT 


AAAATGGGTA 


GCCTTCGGAT 


TTGGAAAGTA 


151 


TTTCACCAGT 


GCCTGGTGCT 


GCCTTGATTT 


CATCATTGTG 


ATTGTCTCTG 


201 


TGACCACCCT 


CATTAACTTA 


ATGGAATTGA 


AGTCCTTCCG 


GACTCTACGA 


251 


GCACTGAGGC 


CTCTTCGTGC 


GCTGTCCCAG 


TTTGAAGGAA 


TGAAGGTGGT 


301 


GGTCAATGCT 


CTCATAGGTG 


CCATACCTGC 


CATTCTGAAT 


GTTTTGCTTG 


351 


TCTGCCTCAT 


TTTCTGGCTC 


GTATTTTGTA 


TTCTGGGAGT 


ATACTTCTTT 


401 


TCTGGAAAAT 


TTGGGAAATG 


CATTAATGGA 


ACAGACTCAG 


TTATAAATTA 


451 


TACCATCATT 


ACAAATAAAA 


GTCAATGTGA 


AAGTGGCAAT 


TTCTCTTGGA 


501 


TCAACCAGAA 


AGTCAACTTT 


GACAATGTGG 


GAAATGCTTA 


CCTCGCTCTG 


551 


CTGCAAGTGG 


CAACATTTAA 


GGGCTGGATG 


GATATTATAT 


ATGCAGCTGT 


601 


TGATTCCACA 


GAGAAAGAAC 


AACAGCCAGA 


GTTTGAGAGC 


AATTCACTCG 


651 


GTTACATTTA 


CTTCGTAGTC 


TTTATCATCT 


TTGGCTCATT 


CTTCACTCTG 


701 


AATCTCTTCA 


TTGGCGTTAT 


CATTGACAAC 


TTCAACCAAC 


AGCAGAAAAA 


751 


GTTAGGTGGC 


CAAGACATTT 


TTATGACAGA 


AGAACAGAAG 


AAATACTATA 


801 


ATGCAATGAA 


AAAATTAGGA 


TCCAAAAAAC 


CTCAAAAACC 


CATTCCACGG 



851 CCCGTT 
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Figure 3B: SEQ ID NO:3 



(Ligne superieure: -PN5 humain) 
(Ligne inferieure: PN5 de rat) 

1 [ ! LSSGA 5 

Mill 

1001 LSCHFLCHKTDKRKSPWVLWWNIRKTCYQIVKHSWFESFIIFVILLSSGA 1050 

6 LIFEDVHLENOPKIQELLNCTDI1FTHIFILEMVLKWVAFGFGKYFTSAW 55 

MINIM ..|.::.|| III III IhllhllMIIII =111111 
1051 LIFEDVNLPSRPQVEKLLRCTDNIFTFIFLLEMILKWVAFGFRRYFTSAW 1100 

56 CCLDFIIVIVSVTTLINLMELKSFRTLRALRPLRALSQFEGMKWVNALI 105 

I IIMIhll! -Ml llllllllllllllllllllllllll III 
1101 CWLDFLIVWSVLSLMNLPSLKSFRTLRALRPLRALSQFEGMKWVYALI 1150 

106 GAIPAILNVLLVCLIFWLVFCILGVYFFSGKFGKCINGTD. .SVINYTII 153 
llllllllllllllllllllllll lllllhllllll : ! 

1151 SAIPAILNVLLVCLIFWLVFCILGVNLFSGKFGRCINGTDINMYLDFTEV 1200 

154 TNKSQCESGNFSWINQKVNFDNVGNAYLALLQVATFKGWMDIIYAAVDST 203 

hill Ml ■ III lllllill I II II I h II I -I- Mill 
1201 P^SQCNISNYSWKVPQVNFDNVGNAYLALLQVATYKGWLEIhlNAAVDSR 1250 

204 EKEQQPEFESNSLGYIYFWFIIFGSFFTLNLFIGVIIDNFNQQQKKLGG 253 

M::||:||.| | : | II I I I II I I I I I I I I I II I I II I II II I II I II 
1251 EKDEQPDFEANLYAYLYFWFIIFGSFFTLNLFIGVIIDNFNQQQKKLGG 1300 

254 QDIFMTEEQKKYYNAMKKLGSKKPQKPIPRPV 285 

Mill 1 1 1 III III I II II Ml Mill III ■ 

1301 QDIFMTEEQKKYYNAMKKLGTKKPQKPIPRPLNKCQAFVFDLVTSQVFDV 1350 
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Figure 4: SEQ ID NO:4 

1 CTCAACATGG TTACGATGAT GGTGGAGACC GACGAGCAGG GCGAGGAGAA 

51 GACGAAGGTT CTGGGCAGAA TCAACCAGTT CTTTGTGGCC GTCTTCACGG 

101 GCGAGTGTGT GATGAAGATG TTCGCCCTGC GACAGTACTA TTTCACCAAC 

151 GGCTGGAACG TGTTCGAcTT CATAGTGGTG ATCCTGTCCA TTGGGAGTCT 

201 GCTGTTTCT GCAATCCTTA AGTCACTGGA AAACTACTTC TCCCCGACGC 

251 TCTTCCGGGT CATCCGTCTG GCCAGGATCG GCCGC ATCCT CAGGCTGATC 

301 CGAGCAGCCA AGGGGATTCG CACGCTGCTC TTCGCCCTCA TGATGTCCCT 

351 GCCCGCCCTC TTCAACATCG GCCTCCTCCT CTTCCTCGtC ATGTTCATCT 

401 ACTCCATCTT CGGCATGGCC AGCTTCGCTA ACGTCGTGGA CGAGGCCGGC 

4 51 ATCGACGACA TGTTCAACTT CAAGACCTTT GGCAACAGCA TGCTGTGCCT 

501 GTTCCAGATC ACCACCTCGG CCGGCTGGGA CGGCCTCCTC AGCCCCATCC 

551 TCAACACGGG GCCTCCCTAC TGCGACCCCA ACCTGCCCAA CAGCAACGGC 

601 TCCCGGGGGA ACTGCGGGAG CCCGGCGGTG GGCATCATCT TCTTCACCAC 

651 CTACATCATC ATCTCCTTCC TCATCGTGGT CAACATGTAT ATCGCAGTCA 

701 TC 
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Figure 5A: SEQ ID NO: 5 



1 


GTCGACTCTA 


GATCAGGGTG 


AAG&IGGAGG 


AGAGGTACTA 


CCCGGTGATC 


51 


TTCCCGGACG 


AGCGGAATTT 


CCGCCCCTTC 


ACTTCCGACT 


CTCTGGCTGC 


101 


CATAGAGAAG 


CGGATTGCTA 


TCCAAAAGGA 


GAGGAAGAAG 


TCCAAAGACA 


151 


AGGCGGCAGC 


TGAGCCCCAG 


CCTCGGCCTC 


AGCTTGACCT 


AAAGGCCTCC 


201 


AGGAAGTTAC 


CTAAGCTTTA 


TGGTGACATT 


CCCCCTGAGC 


TTGTAGCGAA 


251 


GCCTCTGGAA 


GACCTGGACC 


CATTCTACAA 


AGACCATAAG 


ACATTCATGG 


301 


TGTTGAACAA 


GAAGAGAACA 


ATTTATCGCT 


TCAGCGCCAA 


GCGGGCCTTG 


351 


TTCATTCTGG 


GGCCTTTTAA 


TCCCCTCAGA 


AGCTTAATGA 


TTCGTATCTC 


401 


TGTCCATTCA 


GTCTTTAGCA 


TGTTCATCAT 


CTGCACGGTG 


ATCATCAACT 


451 


GTATGTTCAT 


GGCGAATTCT 


ATGGAGAGAA 


GTTTCGACAA 


CGACATTCCC 


501 


GAATACGTCT 


TCATTGGGAT 


TTATATTTTA 


GAAGCTGTGA 


TTAAAATATT 


551 


GGCAAGAGGC 


TTCATTGTGG 


ATGAGTTTTC 


CTTCCTCCGA 


GATCCGTGGA 


601 


ACTGGCTGGA 


CTTCATTGTC 


ATTGGAACAG 


CGATCGCAAC 


TTGTTTTCCG 


651 


GGCAGCCAAG 


TCAATCTTTC 


AGCTCTTCGT 


ACCTTCCGAG 


TGTTCAGAGC 


701 


TCTGAAGGCG 


ATTTCAGTTA 


TCTCAGGTCT 


GAAGGTCATC 


GTAGGTGCCC 


751 


TGCTGCGCTC 


GGTGAAGAAG 


CTGGTAGACG 


TGATGGTCCT 


CACTCTCTTC 


801 


TGCCTCAGCA 


TCTTTGCCCT 


GGTCGGTCAG 


CAGCTGTTCA 


TGGGAATTCT 


851 


GAACCAGAAG 


TGTATTAAGC 


ACAACTGTGG 


CCCCAACCCT 


GCATCCAACA 


901 


AGGATTGCTT 


TGAAAAGGAA 


AAAGATAGCG 


AAGACTTCAT 


AATGTGTGGT 


951 


ACCTGGCTCG 


GCAGCAGACC 


CTGTCCCAAT 


GGTTCTACGT 


GCGATAAAAC 


1001 


CACATTGAAC 


CCAGACAATA 


ATTATACAAA 


GTTTGACAAC 


TTTGGCTGGT 


1051 


CCTTTCTCGC 


CATGTTCCGG 


GTTATGACTC 


AAGACTCCTG 


GGAGAGGCTT 


1101 


TACCGACAGA 


TCCTGCGGAC 


CTCTGGGATC 


TACTTTGTCT 


TCTTCTTCGT 
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Figure 5B: SEQ ID NO: 5 



1151 

X X J X 


GGTGGTCATC 


TTCCTGGGCT 


CCTTCTACCT 


GCTTAACCTA 


ACCCTGGCTG 


1201 


TTGTCACCAT 


GGCTTATGAA 


GAACAGAACA 


GAAATGTAGC 


TGCTGAGACA 


JLZ 0 x 


rtAGGCCAAGG 


AGAAAATGTT 


TCAGGAAGCC 


CAGCAGCTGT 


TAAGGGAGGA 


JIjUa 


P A A PP APPPT 


CTGGTTGCCA 


TGGGAATTGA 


CAGAAGTTCC 


CTTAATTCCC 


1 1C1 

1 J 51 


X X vnnutv XIV— 


ATPCTTTTCC 


CCGAAGAAGA 


GGAAGTTTTT 


CGGTAGTAAG 


J. 4 UX 


>pa 2k,P A IV APT 


PPTTCTTTAT 

V»» X -L \+ X X X •» X 


GAGAGGGTCC 


AAGACGGCCC 


AAGCCTCAGC 


1 9 D I 


olLl on 1 X v^/-\ 


GAGGACGATG 


CCTCTAAAAA 


TCCACAGCTC 


CTTGAGCAGA 




PPAAAPGACT 


GTCCCAGAAC 


TTGCCAGTGG 


ATCTCTTTGA 


TGAGCACGTG 


X J J J- 


GAPCCCCTCC 


ACAGGCAGAG 


AGCGCTGAGC 


GCTGTCAGTA 


TCTTAACCAT 


1 fiOl 


PACCATGCAG 


GAACAAGAAA 


AATTCCAGGA 


GCCTTGTTTC 


CCATGTGGGA 


1651 

X V _> X 


AAAATTTGGC 


CTCTAAGTAC 


CTGGTGTGGG 


ACTGTAGCCC 


TCAGTGGCTG 


1701 

X « V X 


TGCATAAAGA 


AGGTCCTGCG 


GACCATCATG 


ACGGATCCCT 


TTACTGAGCT 


1751 


GGCCATCACC 


ATCTGCATCA 


TCATCAATAC 


CGTTTTCTTA 


GCCGTGGAGC 


1801 


ACCACAACAT 


GGATGACAAC 


TTAAAGACCA 


TACTGAAAAT 


AGGAAACTGG 


1851 


GTTTTCACGG 


GAATTTTCAT 


AGCGGAAATG 


TGTCTCAAGA 


TCATCGCGCT 


1901 


CGACCCTTAC 


CACTACTTCC 


GGCACGGCTG 


GAATGTTTTT 


GACAGCATCG 


1951 


TGGCCCTCCT 


GAGTCTCGCT 


GATGTGCTCT 


ACAACACACT 


GTCTGATAAC 


2001 


AATAGGTCTT 


TCTTGGCTTC 


CCTCAGAGTG 


CTGAGGGTCT 


TCAAGTTAGC 


2051 


CAAATCCTGG 


CCCACGTTAA 


ACACTCTCAT 


TAAGATCATC 


GGCCACTCCG 


2101 


TGGGCGCGCT 


J, vjbAAALL. I o 


A PTPTPPTPP 


TPAPTATPPT 


GGTCTTCATC 


2151 


TTTTCTGTGG 


TGGGCATGCG 


GCTCTTCGGC 


ACCAAGTTTA 


ACAAGACCGC 


2201 


CTACGCCACC 


CAGGAGCGGC 


CCAGGCGGCG 


CTGGCACATG 


GATAATTTCT 


2251 


ACCACTCCTT 


CCTGGTGGTG 


TTCCGCATCC 


TCTGTGGGGA 


ATGGATCGAG 


2301 


AACATGTGGG 


GCTGCATGCA 


GGATATGGAC 


GGCTCCCCGT 


TGTGCATCAT 
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Figure 5C: SEQ ID NO: 5 



2351 


iulLi 1 iV9 1L 


PTnAf AATGG 

X Vjrt X /T-TV X V70 


TGATCGGGAA 


GCTTGTGGTG 


CTTAACCTCT 


2 4 Ul 


ILAi x\a^U 1 x 


^PTGPTPAAT 


TCPTTPAGCA 


ATGAGGAGAA 


GGATGGGAGC 


2 4 b J. 


ptop & Af2f2 An 


AGAPPAGGAA 


AAPPAAAGTG 


CAGCTAGCCC 


TGGATCGGTT 


o c n 1 
2bUx 




TTPTPPTTPA 


TGCTGCACGC 


TCTTCAGAGT 


TTTTGTTGCA 


2 bbl 




G AGG AAAAAC 


TPGPCAAAGC 


CAAAAGAGAC 


AACAGAAAGC 


2oUx 


X i X VjL, loo lu 


AGAATAAAGA 


CTCAATCCTC 


CCGGATGCGA 


GGCCCTGGAA 


ZD jl 


GGAGTATGAT 


ACAGACATGG 


CTTTGTACAC 


TGGACAGGCC 


GGGGCTCCGC 


Z / U X 


tggppppact 


CGCAGAGGTA 


GAGGACGATG 


TGGAATATTG 


TGGTGAAGGC 


Z / J J. 


GGTGPCCTAC 


CCACCTCACA 


ACATAGTGCT 


GGAGTTCAGG 


CCGGTGACCT 


9 ROT 

Z O v J- 


PPPTPPAGAG 


ACCAAGCAGC 


TCACTAGCCC 


GGATGACCAA 


GGGGTTG AAA 


9RM 

ZOJX 


TGGAAGTATT 


TTCTGAAGAA 


GATCTGCATT 


TAAGCATACA 


GAGTCCTCGA 


9Q01 

Z ^7 U X 


A AG A AGTPTG 


APGCAGTGAG 


CATGCTCTCG 

•* rib \* Vp» A rib *v 


GAATGCAGCA 


CAATTGACCT 


Z 7 J X 


f^AATGATATP 


TTTAGAAATT 


TACAGAAAAC 


AGTTTCCCCC 


AAAAAGCAGC 




PAGATAGATG 


CTTTCCCAAG 


GGCCTTAGTT 


GTCACTTTCT 


ATGCCACAAA 


3 \) _> x 


APAGAPAAGA 


GAAAGTCCCC 


CTGGGTCCTG 


TGGTGGAACA 


TTCGGAAAAC 


_J _L W _L 
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Figure 5D: SEQ ED NO: 5 

3551 TTTATTTTCT GGGAAGTTTG GAAGGTGCAT TAACGGGACA GACATAAATA 

3601 TGTATTTGGA TTTTACCGAA GTTCCGAACC GAAGCCAATG TAACATTAGT 

3651 AATTACTCGT GGAAGGTCCC GCAGGTCAAC TTTGACAACG 'TGGGGAATGC 

3701 CTATCTCGCC CTGCTGCAAG TGGCAACCTA TAAGGGCTGG CTGGAAATCA 

3751 TGAATGCTGC TGTCGATTCC AGAGAGAAAG ACGAGCAGCC GGACTTTGAG 

3801 GCGAACCTCT ACGCGTATCT CTACTTTGTG GTTTTTATCA TCTTCGGCTC 

3851 CTTCTTTACC CTGAACCTCT TTATCGGTGT TATTATTGAC AACTTCAATC 

3901 AGCAGCAGAA AAAGTTAGGT GGCCAAGACA TCTT£ATGAC IGAQGAQCAG 

3951 AAGAAATATT ACAATGCAAT GAAAAAGTTA GGAACCAAGA AACCTCAAAA 

4001 GCCCATCCCA AGGCCCCTGA ACAAATGTCA AGCCTTTGTG TTCGACCTGG 

4051 TCACAAGCCA GGTCTTTGAC GTCATCATTC TGGGTCTTAT TGTCTTAAAT 

4101 ATGATTATCA TGATGGCTGA ATCTGCCGAC CAGCCCAAAG ATGTGAAGAA 

4151 AACCTTTGAT ATCCTCAACA TAGCCTTCGT GGTCATCTTT ACCATAGAGT 

4201 GTCTCATCAA AGTCTTTGCT TTGAGGCAAC ACTACTTCAC CAATGGCTGG 

4251 AACTTATTTG ATTGTGTGGT CGTGGTTCTT TCTATCATTA GTACCCTGGT 

4 301 TTCCCGCTTG GAGGACAGTG ACATTTCTTT CCCGCCCACG CTCTTCAGAG 

4351 TCGTCCGCTT GGCTCGGATT GGTCGAATCC TCAGGCTGGT CCGGGCTGCC 

4401 CGGGGAATCA GGACCCTCCT CTTTGCTTTG ATGATGTCTC TCCCCTCTCT 

4451 CTTCAACATC GGTCTGCTGC TCTTCCTGGT GATGTTCATT TACGCCATCT 

4501 TTGGGATGAG CTGGTTTTCC AAAGTGAAGA AGGGCTCCGG GATCGACGAC 

4551 ATCTTCAACT TCGAGACCTT TACGGGCAGC ATGCTGTGCC TCTTCCAGAT 

4 601 AACCACTTCG GCTGGCTGGG ATACCCTCCT CAACCCCATG CTGGAGGCAA 

4 651 AAGAACACTG CAACTCCTCC TCCCAAGACA GCTGTCAGCA GCCGCAGATA 

4701 GCCGTCGTCT ACTTCGTCAG TTACATCATC ATCTCCTTCC TCATCGTGGT 
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